回答編集履歴

修正

2020/08/28 17:37

投稿

スコア21960

answer CHANGED Viewed

@@ -39,4 +39,4 @@
 Pytorch の CPU 実装は以下です。
-[pytorch/Normalization.cpp at master · pytorch/pytorch](https://github.com/pytorch/pytorch/blob/master/aten/src/ATen/native/Normalization.cpp#L62)
+[pytorch/Normalization.cpp at master · pytorch/pytorch](https://github.com/pytorch/pytorch/blob/master/aten/src/ATen/native/Normalization.cpp)

修正

2020/08/28 17:37

投稿

スコア21960

answer CHANGED Viewed

@@ -35,4 +35,8 @@
 params = dict(bn.named_parameters())
 print("w", params["weight"].shape)
 print("b", params["bias"].shape)
-```
+```
+Pytorch の CPU 実装は以下です。
+[pytorch/Normalization.cpp at master · pytorch/pytorch](https://github.com/pytorch/pytorch/blob/master/aten/src/ATen/native/Normalization.cpp#L62)

修正

2020/08/28 17:37

投稿

スコア21960

answer CHANGED Viewed

@@ -11,14 +11,14 @@
 入力が (バッチサイズ, N) としたとき、各次元ごとに平均μ_iと標準偏差σ_iを計算し、
 x'_i = (x_i - μ_i) / σ_i で平均0、分散1に正規化します。
-そして、推論時用に平均と分散を[移動平均](https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87)で更新しながら記録します。
+そして、推論時用に平均と標準偏差を[移動平均](https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87)で更新しながら記録します。
-running_mean_i = (1 - λ) running_mean_i + λ mean_i
-running_std_i = (1 - λ) running_std_i + λ std_i
+μ'_i = (1 - λ) μ'_{i - 1} + λ μ_i
+σ'_i = (1 - λ) σ'_{i - 1} + λ σ_i
 > 平均と標準偏差を用いて各バッチの入力を正規化するのに対して、推論時はどういったパラメータを用いて中間入出力の値を正規化するのか知りたい。
-学習時に記録しておいたμ、σを使用して、入力データに対して x'_i = (x_i - μ_i) / σ_i を同様に適用します。
+学習時に記録しておいたμ'、σ'を使用して、入力データに対して x'_i = (x_i - μ'_i) / σ'_i を同様に適用します。
 以上がシンプルな Batch Noramlization ですが、一般的にはこれに加えて標準化後の出力に対して、アフィン変換を行います。(Pytorch の場合は affine=True を指定した場合)

修正

2020/08/28 17:31

投稿

スコア21960

answer CHANGED Viewed

@@ -33,6 +33,6 @@
 # アフィン変換 wX + b のパラメータ (affine=True の場合)
 params = dict(bn.named_parameters())
-print("v", params["weight"].shape)
+print("w", params["weight"].shape)
 print("b", params["bias"].shape)
 ```

修正

2020/08/28 17:28

投稿

スコア21960

answer CHANGED Viewed

@@ -11,7 +11,7 @@
 入力が (バッチサイズ, N) としたとき、各次元ごとに平均μ_iと標準偏差σ_iを計算し、
 x'_i = (x_i - μ_i) / σ_i で平均0、分散1に正規化します。
-そして、推論時用に平均と分散を[移動平均](https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87)で更新します。
+そして、推論時用に平均と分散を[移動平均](https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87)で更新しながら記録します。
 running_mean_i = (1 - λ) running_mean_i + λ mean_i
 running_std_i = (1 - λ) running_std_i + λ std_i

修正

2020/08/28 17:27

投稿

スコア21960

answer CHANGED Viewed

@@ -18,9 +18,9 @@
 > 平均と標準偏差を用いて各バッチの入力を正規化するのに対して、推論時はどういったパラメータを用いて中間入出力の値を正規化するのか知りたい。
-学習時に記録しておいたμ、σを使用して、入力データに対して推論します。
+学習時に記録しておいたμ、σを使用して、入力データに対して x'_i = (x_i - μ_i) / σ_i を同様に適用します。
-以上がシンプルな Batch Noramlization ですが、一般的にはこれに加えて標準化後の出力に対して、アフィン変換を行います。(Pytroch の場合は affine=True を指定した場合)
+以上がシンプルな Batch Noramlization ですが、一般的にはこれに加えて標準化後の出力に対して、アフィン変換を行います。(Pytorch の場合は affine=True を指定した場合)
 ```python
 import torch