回答編集履歴

1

ミスってたので消す

2021/03/26 14:51

投稿

hayataka2049
hayataka2049

スコア30935

test CHANGED
@@ -15,35 +15,3 @@
15
15
 
16
16
 
17
17
  y=1が誤差最小であり、そのときちゃんと∂E/∂wi=0です。教師ラベル=0の項を足したりマルチラベルにしたりしても(その場合はsigmoidの一般化のsoftmaxでやってください)基本的には同じです。
18
-
19
-
20
-
21
- > 重みを変数として見た場合2次関数のように下向きに凸の形を取らず、「極小値をとる点で傾きが0になる」という考えを当てはめることはできないように思えます。
22
-
23
-
24
-
25
- 負の側の項も考慮して、正解はytと書くことにすると、
26
-
27
-
28
-
29
- E=−yt log y − (1−yt)log(1−y)
30
-
31
-
32
-
33
- で、微分して、
34
-
35
-
36
-
37
- ∂E/∂y = - yt/y - (1-yt)/(1-y)
38
-
39
-
40
-
41
- 上と同様にやって、
42
-
43
-
44
-
45
- ∂E/∂wi = ((-yt(1-y) -y(1-yt))xi = (-y + 2 * y * yt - yt)xi = -(sqrt(y) - sqrt(yt))^2 * xi
46
-
47
-
48
-
49
- である、という事実はあったりはするんじゃないでしょうか。