回答編集履歴
1
ミスってたので消す
test
CHANGED
@@ -15,35 +15,3 @@
|
|
15
15
|
|
16
16
|
|
17
17
|
y=1が誤差最小であり、そのときちゃんと∂E/∂wi=0です。教師ラベル=0の項を足したりマルチラベルにしたりしても(その場合はsigmoidの一般化のsoftmaxでやってください)基本的には同じです。
|
18
|
-
|
19
|
-
|
20
|
-
|
21
|
-
> 重みを変数として見た場合2次関数のように下向きに凸の形を取らず、「極小値をとる点で傾きが0になる」という考えを当てはめることはできないように思えます。
|
22
|
-
|
23
|
-
|
24
|
-
|
25
|
-
負の側の項も考慮して、正解はytと書くことにすると、
|
26
|
-
|
27
|
-
|
28
|
-
|
29
|
-
E=−yt log y − (1−yt)log(1−y)
|
30
|
-
|
31
|
-
|
32
|
-
|
33
|
-
で、微分して、
|
34
|
-
|
35
|
-
|
36
|
-
|
37
|
-
∂E/∂y = - yt/y - (1-yt)/(1-y)
|
38
|
-
|
39
|
-
|
40
|
-
|
41
|
-
上と同様にやって、
|
42
|
-
|
43
|
-
|
44
|
-
|
45
|
-
∂E/∂wi = ((-yt(1-y) -y(1-yt))xi = (-y + 2 * y * yt - yt)xi = -(sqrt(y) - sqrt(yt))^2 * xi
|
46
|
-
|
47
|
-
|
48
|
-
|
49
|
-
である、という事実はあったりはするんじゃないでしょうか。
|