質問編集履歴

該当コードを載せないと分かりにくいとのご指摘を受けたのでコードを載せました。

2022/02/11 13:36

投稿

ai_learner

スコア10

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,4 +1,4 @@
-# 解決したい問題
+![# 解決したい問題
 3600個の画像データをミニバッチ処理するCNNを含んだニューラルネットワークの中の活性化関数の手前にBatch Normalizationを入れたいが、一個でも入れると　”ValueError: operands could not be broadcast together with shapes (50176,16) (12544,16) ”と　エラーが出てしまい実行できない。
 該当する行列はmu(バッチ正規化する際の平均値）の行列
@@ -8,41 +8,198 @@
 なぜなら、上記の例では、データ数：3600、batch size:64でその商が56と1/4であり、12544は50176の1/4であるからだ。
 しかし、バッチサイズをデータ数を割り切れる数字(例：100)に設定したところ、再び、”ValueError: operands could not be broadcast together with shapes (78400,16) (2822400,16) ”とエラーが出てしまい、何が原因なのか、わからなくなってしまいました。
+### 該当コード
+### テキスト畳み込みニューラルネットワーク（ゼロから作るディープラーニング１のドロップアウトをバッチノーマライゼーションに変更）は文字数制約のため添付写真に表示
+#### バッチノーマライゼーションのコード
-エラー文全文
+```Python3
+class BatchNormalization:
+    def __init__(self, gamma, beta, rho=0.9, moving_mean=None, moving_var=None):
+        self.gamma = gamma # 学習によって更新させる.
+        self.beta = beta #  学習によって更新させる
+        self.rho = rho
+        # 予測時に使用する平均と分散
+        self.moving_mean = moving_mean   # muの移動平均
+        self.moving_var = moving_var     # varの移動平均
+        # 計算中に算出される値を保持しておく変数群
+        self.batch_size = None
+        self.x_mu = None
+        self.x_std = None
+        self.std = None
+        self.dgamma = None
+        self.dbeta = None
+    def forward(self, x, train_flg=True):
+        """
+        順伝播計算
+        x :  CNNの場合は4次元、全結合層の場合は2次元
+        """
+        if x.ndim == 4:
+            """
+            画像形式の場合
+            """
+            N, C, H, W = x.shape
+            x = x.transpose(0, 2, 3, 1) # NHWCに入れ替え
+            x = x.reshape(N*H*W, C) # (N*H*W,C)の2次元配列に変換
+            out = self.__forward(x, train_flg)
+            out = out.reshape(N, H, W, C)# 4次元配列に変換
+            out = out.transpose(0, 3, 1, 2) # 軸をNCHWに入れ替え
+        elif x.ndim == 2:
+            """
+            画像形式以外の場合
+            """
+            out = self.__forward(x, train_flg)
+        return out
-`ValueError                                Traceback (most recent call last)
+    def __forward(self, x, train_flg, epsilon=1e-8):
+        """
+        x : 入力. N×Dの行列. Nはバッチサイズ. Dは手前の層のノード数
+        """
-<ipython-input-33-eaa9794c89e7> in <module>
+        if (self.moving_mean is None) or (self.moving_var is None):
+            N, D = x.shape
+            self.moving_mean = np.zeros(D)
+            self.moving_var = np.zeros(D)
+        if train_flg:
+            """
-     43
+            学習時
+            """
+            # 入力xについて、Nの方向に平均値を算出.
+            N, D = x.shape
+            mu = np.mean(x, axis=0) # 要素数D個のベクトル
+            mu = np.broadcast_to(mu, (N, D)) # Nの方向にブロードキャスト
+            print("mu.shape=", mu.shape)
+            # 入力xから平均値を引く
-     44     # 訓練データにおけるloss
+            x_mu = x - mu   # N×D行列
+            print("x_mu.shape=", x_mu.shape)
+            # 入力xの分散を求める
+            var = np.mean(x_mu**2, axis=0)  # 要素数D個のベクトル
+            print("var.shape=", var.shape)
+            # 入力xの標準偏差を求める(epsilonを足してから標準偏差を求める)
+            std = np.sqrt(var + epsilon)  # 要素数D個のベクトル
+            print("std.shape=", std.shape)
+            # 標準偏差の逆数を求める
+            std_inv = 1 / std
+            std_inv = np.broadcast_to(std_inv, (N, D)) # Nの方向にブロードキャスト
----> 45     train_loss.append(dcn.loss(X_train,  y_train))
+            print("std_inv.shape=", std_inv.shape)
-     46
+            # 標準化
-     47     # テストデータにおけるloss
+            x_std = x_mu * std_inv  #N*D行列
+            print("x_std.shape=", x_std.shape)
+            # 値を保持しておく
+            self.batch_size = x.shape[0]
+            self.x_mu = x_mu
+            self.x_std = x_std
+            self.std = std
+            self.moving_mean = self.rho * self.moving_mean + (1-self.rho) * mu
+            self.moving_var = self.rho * self.moving_var + (1-self.rho) * var
+        else:
+            """
+            予測時
+            """
+            x_mu = x - self.moving_mean # N*D行列
+            x_std = x_mu / np.sqrt(self.moving_var + epsilon) # N*D行列
+        # gammaでスケールし、betaでシフトさせる
+        out = self.gamma * x_std + self.beta # N*D行列
+        return out
-<ipython-input-9-a33e61666ae3> in loss(self, x, t)
-     63
-     64     def loss(self, x, t):
+    def backward(self, dout):
+        """
+        逆伝播計算
+        dout : CNNの場合は4次元、全結合層の場合は2次元
+        """
+        if dout.ndim == 4:
+            """
+            画像形式の場合
+            """
+            N, C, H, W = dout.shape
----> 65         y = self.predict(x, train_flg=True)
+            dout = dout.transpose(0, 2, 3, 1) # NHWCに入れ替え
+            dout = dout.reshape(N*H*W, C) # (N*H*W,C)の2次元配列に変換
-     66         return self.last_layer.forward(y, t)
+            dx = self.__backward(dout)
+            dx = dx.reshape(N, H, W, C)# 4次元配列に変換
+            dx = dx.transpose(0, 3, 1, 2) # 軸をNCHWに入れ替え
+        elif dout.ndim == 2:
+            """
-     67
+            画像形式以外の場合
+            """
+            dx = self.__backward(dout)
-<ipython-input-9-a33e61666ae3> in predict(self, x, train_flg)
-     59                 x = layer.forward(x, train_flg)
-     60             else:
----> 61                 x = layer.forward(x)
-     62         return x
+        return dx
-     63
-~/Downloads/*****/畳み込み/common/layers.py in forward(self, x, train_flg)
+    def __backward(self, dout):
+        """
+        ここを完成させるには、計算グラフを理解する必要があり、実装にかなり時間がかかる.
+        """
+        N, D = self.x_.shape
+        # betaの勾配
-    315             x = x.transpose(0, 2, 3, 1) # NHWCに入れ替え
+        dbeta = np.sum(dout, axis=0)
-    316             x = x.reshape(N*H*W, C) # (N*H*W,C)の2次元配列に変換
+        # gammaの勾配(Nの方向に合計)
---> 317             out = self.__forward(x, train_flg)
+        dgamma = np.sum(self.x_std * dout, axis=0)
+        # Xstdの勾配
+        a1 = self.gamma * dout
+        print("a1.shape=", a1.shape)
+        # Xmuの勾配(1つ目)
+        a2 = a1 / self.std
+        print("a2.shape=", a2.shape)
+        # 標準偏差の逆数の勾配
+        a3 = a1 * self.x_mu
+        print("a3.shape=", a3.shape)
+        a3 = np.sum(a3, axis=0) # Nの方向に合計
+        # 標準偏差の勾配
+        a4 = -(a3) / (self.std * self.std)
+        print("a4.shape=", a4.shape)
+        # 分散の勾配
+        a5 = 0.5 * a4 / self.std
+        print("a5.shape=", a5.shape)
+        # Xmuの2乗の勾配
+        a6 = a5 / self.batch_size
-    318             out = out.reshape(N, H, W, C)# 4次元配列に変換
+        a6 = np.broadcast_to(a6, (N, D)) # Nの方向にブロードキャスト
+        print("a6=",a6)
+        print("a6.shape=", a6.shape)
+        # Xmuの勾配(2つ目)
+        a7 = 2.0  * self.x_mu * a6
+        print("a7.shape=", a7.shape)
+        # muの勾配
+        a8 = -(a2+a7)
+        print("a8.shape=", a8.shape)
-    319             out = out.transpose(0, 3, 1, 2) # 軸をNCHWに入れ替え
+        a8 = np.sum(a8, axis=0) # Nの方向に合計
+        # Xの勾配
+        a9 = a8 / self.batch_size
+        a9 = np.broadcast_to(a9, (N, D)) # Nの方向にブロードキャスト
+        dx = a2 + a7 + a9
+        print("a9.shape=", a9.shape)
+        self.dgamma = dgamma
+        self.dbeta = dbeta
+        return dx
+```
+エラー文
 ~/Downloads/*****/畳み込み/common/layers.py in __forward(self, x, train_flg, epsilon)
     371             self.x_std = x_std
     372             self.std = std
@@ -54,7 +211,7 @@
-ご回答いただけたら、幸いです。
+ご回答いただけたら、幸いです。](https://ddjkaamml8q8x.cloudfront.net/questions/2022-02-11/a99998cf-725f-4dac-8169-3cab12cdf9b5.png)

NumPy Python 3.x

ミニバッチ処理していることを明記していなかったので、明記いたしました。

2022/02/09 02:27

投稿

ai_learner

スコア10

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,5 +1,5 @@
 # 解決したい問題
-3600個の画像データを処理するCNNを含んだニューラルネットワークの中の活性化関数の手前にBatch Normalizationを入れたいが、一個でも入れると　”ValueError: operands could not be broadcast together with shapes (50176,16) (12544,16) ”と　エラーが出てしまい実行できない。
+3600個の画像データをミニバッチ処理するCNNを含んだニューラルネットワークの中の活性化関数の手前にBatch Normalizationを入れたいが、一個でも入れると　”ValueError: operands could not be broadcast together with shapes (50176,16) (12544,16) ”と　エラーが出てしまい実行できない。
 該当する行列はmu(バッチ正規化する際の平均値）の行列
 # 自分なりに考えたこと

NumPy Python 3.x