編集履歴

質問編集履歴

修正しました

2021/01/04 04:32

投稿

redcatML

スコア26

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -99,7 +99,7 @@
     #全結合層誤差
     Error2 = (t - y) * (1 - y) * y
-    a = -1e-5
+    a = 1e-5
     #affine層更新
     w_affine += a * np.dot(z.T, Error2)

コード修正しました

2021/01/04 04:32

投稿

redcatML

スコア26

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -5,9 +5,12 @@
 CNNの構成は、入力→畳み込み層→畳み込み層2→全結合層を想定しています。
 全結合層から２乗誤差を逆伝搬して誤差逆伝搬を実装しています。
-下のプログラムでは、簡略化のために、入力と重みはnp.arrangeで実装しています。
+下のプログラムでは、簡略化のために、入力はnp.arrangeで実装しています。
 入力はmnistを想定してのこの形となっています。
+学習した結果、テストしたところ、出力の最大の要素が全て同じになってしまい、正しく学習がされていないようです。
+col2imや逆伝搬の使い方に誤りがあるのでしょうか？
 ```python
 import numpy as np
@@ -45,14 +48,91 @@
     return img[:, :, pad:H + pad, pad:W + pad]
+def f(x):
+    y = 1 / (1 + np.exp(-0.01*x))
+    return y
+#フィルタ
+#w = np.arange(5*1*9*9).reshape(5,1,9,9)
+w = np.random.rand(5,1,9,9)/100
+#2層目フィルタ
+#w2 = np.arange(5*5*9*9).reshape(5,5,9,9)
+w2 = np.random.rand(5,5,9,9)/100
+#全結合層重み
+w_affine = np.random.rand(6*6*5,10)/100
+for i in range(1000):#学習回数
+    #入力
+    x = np.arange(6*1*28*28).reshape(6,1,28,28)
+    x = 0.0001*x
+    #入力2次元化
+    col_x,out_h,out_w = im2col(x,9,9,1,1,0,0)#入力, フィルタサイズ9, ストライド1
+    #1層目フィルタ2次元化
+    col_w = w.reshape(5,-1).T
+    #1層目畳み込み計算
+    conv1_col = np.dot(col_x, col_w)
+    #1層目畳み込み層変換
+    conv1 = conv1_col.reshape(x.shape[0], out_h, out_w, -1).transpose(0, 3, 2, 1)
+    #2層目フィルタ2次元化
+    col_w2 = w2.reshape(5,-1).T
+    #2層目畳み込み計算(2次元)
+    input_col,out_h,out_w = im2col(conv1,9,9,2,2,0,0)#cov1, フィルタサイズ9,ストライド2
+    conv2_col = np.dot(input_col, col_w2)
+    conv2 = conv2_col.reshape(conv1.shape[0], out_h, out_w, -1).transpose(0, 3, 2, 1)
+    #全結合層出力
+    z = conv2.reshape(conv2.shape[0],-1)
+    y = f(np.dot(z,w_affine))
+    t = np.zeros((6,10))
+    #教師信号
+    for i in range(6):
+        t[i,i]=1
+    #全結合層誤差
+    Error2 = (t - y) * (1 - y) * y
+    a = -1e-5
+    #affine層更新
+    w_affine += a * np.dot(z.T, Error2)
+    #畳み込み層2誤差(1次元)
+    Error1 = np.dot(Error2, w_affine.T)
+    #畳み込み層誤差変換
+    dout2 = Error1.reshape(6,5,6,6)
+    dout2 = dout2.transpose(0,2,3,1).reshape(-1,5)
+    #w2更新
+    dw2 = np.dot(input_col.T,dout2)
+    dw2 = dw2.transpose(1,0).reshape(5,5,9,9)
+    w2 += a * dw2
+    #畳み込み層1誤差
+    dout1_col = np.dot(dout2,col_w2.T)
+    dout1 = col2im(dout1_col,conv1.shape,9,9,2,0)
+    dout1 = dout1.transpose(0,2,3,1).reshape(-1,5)
+    #w1更新
+    dw1 = np.dot(col_x.T,dout1)
+    dw1 = dw1.transpose(1,0).reshape(5,1,9,9)
+    w += a * dw1
+#学習結果をテスト
 #入力
 x = np.arange(6*1*28*28).reshape(6,1,28,28)
 x = 0.0001*x
-print(x)
 #フィルタ
-w = np.arange(5*1*9*9).reshape(5,1,9,9)
+#w = np.arange(5*1*9*9).reshape(5,1,9,9)
-w = 0.01*w
+#w = 0.01*w
 #入力2次元化
 col_x,out_h,out_w = im2col(x,9,9,1,1,0,0)#入力, フィルタサイズ9, ストライド1
@@ -66,8 +146,8 @@
 conv1 = conv1_col.reshape(x.shape[0], out_h, out_w, -1).transpose(0, 3, 2, 1)
 #2層目フィルタ
-w2 = np.arange(5*5*9*9).reshape(5,5,9,9)
+#w2 = np.arange(5*5*9*9).reshape(5,5,9,9)
-w2 = 0.01*w2
+#w2 = 0.01*w2
 #2層目フィルタ2次元化
 col_w2 = w2.reshape(5,-1).T
@@ -78,44 +158,14 @@
 conv2 = conv2_col.reshape(conv1.shape[0], out_h, out_w, -1).transpose(0, 3, 2, 1)
 #全結合層重み
-w_affine = np.random.rand(6*6*5,10)
+#w_affine = np.random.rand(6*6*5,10)
 #全結合層出力
 z = conv2.reshape(conv2.shape[0],-1)
-y = np.dot(z,w_affine)
+y = f(np.dot(z,w_affine))
+y_max = np.argmax(y,axis=1)
-t = np.zeros((6,10))
-#教師信号
-for i in range(6):
-    t[i,i]=1
+print(y)
+print(y_max)
 print(t)
-#全結合層誤差
-Error2 = (t-y)
-#affine層更新
-w_affine += np.dot(z.T, Error2)
-#畳み込み層2誤差(1次元)
-Error1 = np.dot(Error2, w_affine.T)
-#畳み込み層誤差変換
-dout2 = Error1.reshape(6,5,6,6)
-dout2 = dout2.transpose(0,2,3,1).reshape(-1,5)
-#w2更新
-dw2 = np.dot(input_col.T,dout2)
-dw2 = dw2.transpose(1,0).reshape(5,5,9,9)
-w2 += dw2
-#畳み込み層1誤差
-dout1_col = np.dot(dout2,col_w2.T)
-dout1 = col2im(dout1_col,conv1.shape,9,9,2,0)
-dout1 = dout1.transpose(0,2,3,1).reshape(-1,5)
-#w1更新
-dw1 = np.dot(col_x.T,dout1)
-dw1 = dw1.transpose(1,0).reshape(5,1,9,9)
-w += dw1
 ```

コード修正しました

2021/01/04 04:24

投稿

redcatML

スコア26

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -9,6 +9,7 @@
 入力はmnistを想定してのこの形となっています。
 ```python
 import numpy as np
 def im2col(input_data, filter_h, filter_w, stride_h=1, stride_w=1, pad_h=0, pad_w=0):
@@ -90,8 +91,11 @@
 print(t)
 #全結合層誤差
-Error2 = (y-t)
+Error2 = (t-y)
+#affine層更新
+w_affine += np.dot(z.T, Error2)
 #畳み込み層2誤差(1次元)
 Error1 = np.dot(Error2, w_affine.T)

プログラムを修正しました

2021/01/04 03:45

投稿

redcatML

スコア26

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -46,9 +46,12 @@
 #入力
 x = np.arange(6*1*28*28).reshape(6,1,28,28)
+x = 0.0001*x
+print(x)
 #フィルタ
 w = np.arange(5*1*9*9).reshape(5,1,9,9)
+w = 0.01*w
 #入力2次元化
 col_x,out_h,out_w = im2col(x,9,9,1,1,0,0)#入力, フィルタサイズ9, ストライド1
@@ -63,6 +66,7 @@
 #2層目フィルタ
 w2 = np.arange(5*5*9*9).reshape(5,5,9,9)
+w2 = 0.01*w2
 #2層目フィルタ2次元化
 col_w2 = w2.reshape(5,-1).T
@@ -86,11 +90,10 @@
 print(t)
 #全結合層誤差
-Error2 = (t-y)
+Error2 = (y-t)
 #畳み込み層2誤差(1次元)
 Error1 = np.dot(Error2, w_affine.T)
-w_affine += np.dot(z.T, Error2)
 #畳み込み層誤差変換
 dout2 = Error1.reshape(6,5,6,6)
@@ -99,8 +102,7 @@
 #w2更新
 dw2 = np.dot(input_col.T,dout2)
 dw2 = dw2.transpose(1,0).reshape(5,5,9,9)
-w2 +=dw2
+w2 += dw2
-print(dw2.shape)
 #畳み込み層1誤差
 dout1_col = np.dot(dout2,col_w2.T)
@@ -110,5 +112,6 @@
 #w1更新
 dw1 = np.dot(col_x.T,dout1)
 dw1 = dw1.transpose(1,0).reshape(5,1,9,9)
-w+=dw1
+w += dw1
 ```

質問を具体的にしました

2021/01/04 03:40

投稿

redcatML

スコア26

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,7 +1,13 @@
 ゼロから作るdeep learningのim2colとcol2im関数のみを用いて, かんたんな畳込みネットワークを作成しようとしているのですが, うまく学習が行えていません。
-下のプログラムで決定的な誤りが箇所はありますか？
+下のプログラムで決定的な誤りがある箇所はありますか？
 学習率と活性化関数とバイアスは考えないでプログラムしています。
+CNNの構成は、入力→畳み込み層→畳み込み層2→全結合層を想定しています。
+全結合層から２乗誤差を逆伝搬して誤差逆伝搬を実装しています。
+下のプログラムでは、簡略化のために、入力と重みはnp.arrangeで実装しています。
+入力はmnistを想定してのこの形となっています。
 ```python
 import numpy as np