質問編集履歴
1
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,4 +1,18 @@
|
|
1
|
+
Deep learningの学習アルゴリズムにおいて
|
2
|
+
|
3
|
+
ミニバッチの選び出し
|
4
|
+
|
5
|
+
勾配の算出
|
6
|
+
|
7
|
+
パラメーターの更新
|
8
|
+
|
9
|
+
ということを繰り返して
|
10
|
+
|
11
|
+
損失関数の値を最も減らす方向を目指すことは理解し、
|
12
|
+
|
13
|
+
|
14
|
+
|
1
|
-
SGD
|
15
|
+
SGDというパラメータの更新手段については理解できるのですが
|
2
16
|
|
3
17
|
Momentum,AdaGrad,Adamというパラメータの更新手段については
|
4
18
|
|
@@ -11,3 +25,5 @@
|
|
11
25
|
が分かりません
|
12
26
|
|
13
27
|
上の四つの利点とは何なんでしょうか?
|
28
|
+
|
29
|
+
どうかご教授お願いします
|