質問編集履歴
2
誤字、脱字
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,4 +1,4 @@
|
|
1
|
-
**ゼロから作るディープラーニングのp184での質問です。この書籍を持っている方、もしくはこの書籍を使って勉強をしたことがある方だとイメージしやすいと思います。それ以外の方にはわかりにくいと思うので、お願いします
|
1
|
+
**ゼロから作るディープラーニングのp184での質問です。この書籍を持っている方、もしくはこの書籍を使って勉強をしたことがある方だとイメージしやすいと思います。それ以外の方にはわかりにくいと思うので、お願いします**
|
2
2
|
|
3
3
|
|
4
4
|
|
1
わかりやすくした。
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,6 +1,18 @@
|
|
1
|
+
**ゼロから作るディープラーニングのp184での質問です。この書籍を持っている方、もしくはこの書籍を使って勉強をしたことがある方だとイメージしやすいと思います。それ以外の方にはわかりにくいと思うので、お願いします。**
|
2
|
+
|
3
|
+
|
4
|
+
|
1
5
|
**質問**
|
2
6
|
|
7
|
+
どうして、「Xavierの初期値」は√1/nで「Heの初期値」は√2/nでnp.random.randnで設定した重みの初期値を割ると、アクティベーション(活性化関数後の出力データ)の表現力が増すのでしょうか?
|
8
|
+
|
9
|
+
|
10
|
+
|
11
|
+
|
12
|
+
|
13
|
+
※詳しく書くと
|
14
|
+
|
3
|
-
どうして、「Xavierの初期値」は√1/nで「Heの初期値」は√2/nでnp.random.randn(平均0、分散1(標準偏差1)の正規分布(標準正規分布)に従う乱数)を割ると、アクティベーション(活性化関数後の出力データ)の表現力が増すのでしょうか?
|
15
|
+
どうして、「Xavierの初期値」は√1/nで「Heの初期値」は√2/nでnp.random.randnで設定した重みの初期値(平均0、分散1(標準偏差1)の正規分布(標準正規分布)に従う乱数)を割ると、アクティベーション(活性化関数後の出力データ)の表現力が増すのでしょうか?
|
4
16
|
|
5
17
|
|
6
18
|
|