ゼロから作るDeeplearningにあるim2colを用いて,CNNを実装しているのですが, うまく行かない部分があり質問しました。
CNNは, 入力(チャネル数1, 28×28)→畳み込み層1(フィルタ9×9, ストライド1)→畳み込み層2(フィルタ9×9, ストライド2)→全結合層
各畳み込み層はフィルタ数5枚を想定しています。
入力x[6,1,28,28]は, MNISTを想定して縦横28×28, チャネル数1の白黒画像を6枚用意します。
畳み込み層1では, 9×9のフィルタ5枚をストライド1, パディング0で畳み込み, 5×20×20の特徴マップを作製します。
畳み込み層2では, 9×9のフィルタ5枚をストライド2, パディング0で畳み込み, 5×6×6の特徴マップを作製します。
最期に全結合層での出力を行い, 逆伝搬により重みの修正を行います。
順伝搬のプログラムを実行すると下のエラーが出てしまいます。
ValueError: shapes (216,405) and (81,5) not aligned: 405 (dim 1) != 81 (dim 0)
エラーを回避するためには, 画像を一枚づつとフィルタを1枚ずつforで計算しながらしなければエラー回避できず, それではcol2imのメリットがなくなってしまいます。
下記プログラムの問題はどこにあるのでしょうか?
python
1import numpy as np 2 3def im2col(input_data, filter_h, filter_w, stride_h=1, stride_w=1, pad_h=0, pad_w=0): 4 5 N, C, H, W = input_data.shape 6 out_h = (H + 2*pad_h - filter_h)//stride_h + 1 7 out_w = (W + 2*pad_w - filter_w)//stride_w + 1 8 9 img = np.pad(input_data, [(0,0), (0,0), (pad_h, pad_h), (pad_w, pad_w)], 'constant') 10 col = np.zeros((N, C, filter_h, filter_w, out_h, out_w)) 11 12 for y in range(filter_h): 13 y_max = y + stride_h*out_h 14 for x in range(filter_w): 15 x_max = x + stride_w*out_w 16 col[:, :, y, x, :, :] = img[:, :, y:y_max:stride_h, x:x_max:stride_w] 17 18 col = col.transpose(0, 4, 5, 1, 2, 3).reshape(N*out_h*out_w, -1) 19 return col, out_h, out_w 20 21def col2im(col, input_shape, filter_h, filter_w, stride=1, pad=0): 22 N, C, H, W = input_shape 23 out_h = (H + 2*pad - filter_h)//stride + 1 24 out_w = (W + 2*pad - filter_w)//stride + 1 25 col = col.reshape(N, out_h, out_w, C, filter_h, filter_w).transpose(0, 3, 4, 5, 1, 2) 26 27 img = np.zeros((N, C, H + 2*pad + stride - 1, W + 2*pad + stride - 1)) 28 for y in range(filter_h): 29 y_max = y + stride*out_h 30 for x in range(filter_w): 31 x_max = x + stride*out_w 32 img[:, :, y:y_max:stride, x:x_max:stride] += col[:, :, y, x, :, :] 33 34 return img[:, :, pad:H + pad, pad:W + pad] 35 36#入力 37x = np.arange(6*1*28*28).reshape(6,1,28,28) 38 39#フィルタ 40w = np.arange(5*9*9).reshape(5,9,9) 41 42#入力2次元化 43col_x,out_h,out_w = im2col(x,9,9,1,1,0,0)#入力, フィルタサイズ9, ストライド1 44 45#1層目フィルタ2次元化 46col_w = w.reshape(5,-1).T 47 48#1層目畳み込み計算 49conv1_col = np.dot(col_x, col_w) 50 51#1層目畳み込み層変換 52conv1 = conv1_col.reshape(x.shape[0], out_h, out_w, -1).transpose(0, 3, 2, 1) 53 54 55#2層目フィルタ 56w2 = np.arange(5*9*9).reshape(5,9,9) 57 58#2層目フィルタ2次元化 59col_w2 = w.reshape(5,-1).T 60 61#2層目畳み込み計算(2次元) 62input_col,out_h,out_w = im2col(conv1,9,9,2,2,0,0) 63conv2_col = np.dot(input_col, col_w2) 64conv2 = conv2_col.reshape(conv1.shape[0], out_h, out_w, -1).transpose(0, 3, 2, 1) 65 66#全結合層重み 67w_affine = np.random.rand(6*6*5,10) 68 69#全結合層出力 70z = conv.reshape(-1) 71y = np.dot(z,w_affine) 72
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/31 08:21
2020/12/31 12:50