お世話になっております。初めて質問をさせていただく者です。
Deep Learning関連の質問なのですが、非常に優れた関数であるim2colという関数の逆バージョンであるcoltoim関数を実装したいと考えております。
実験の意図としては、画像データとして読み込んだものをim2colによって行列化し、それに以下のコードの演算を加えた後、coltoimによって再び画像化したいと考えています。ただし、演算によって次元の要素が変わってしまうため、上手くいっていない状況です。エラーコードとしては、以下のようなものです。
"cannot reshape array of size 412958720 into shape (1280,71,71,1,5,5)"
以下がソースコードとなります。
Python
1#前提データとして、"T1","Filters","Bias"があります。 2#T1.shape = (画像枚数、チャネル数、画像の縦サイズ、画像の横サイズ) = (1280,1,75,75),Filters.shape = (25,64),Bias.shape = (64,)です。 3 4def im2col(input_data, filter_h, filter_w, stride=1, pad=0): 5 N, C, H, W = input_data.shape 6 out_h = (H + 2*pad - filter_h)//stride + 1 7 out_w = (W + 2*pad - filter_w)//stride + 1 8 9 img = np.pad(input_data, [(0,0), (0,0), (pad, pad), (pad, pad)], 'constant') 10 col = np.zeros((N, C, filter_h, filter_w, out_h, out_w)) 11 12 for y in range(filter_h): 13 y_max = y + stride*out_h 14 for x in range(filter_w): 15 x_max = x + stride*out_w 16 col[:, :, y, x, :, :] = img[:, :, y:y_max:stride, x:x_max:stride] 17 18 col = col.transpose(0, 4, 5, 1, 2, 3).reshape(N*out_h*out_w, -1) 19 return col 20 21def coltoim(col, input_data, filter_h, filter_w, stride=1, pad=0): 22 N, C, H, W = input_data.shape 23 out_h = (H + 2*pad - filter_h)//stride + 1 24 out_w = (W + 2*pad - filter_w)//stride + 1 25 col = col.reshape(N, out_h, out_w, C, filter_h, filter_w).transpose(0, 3, 4, 5, 1, 2) 26 27 img = np.zeros((N, C, H + 2*pad + stride - 1, W + 2*pad + stride - 1)) 28 for y in range(filter_h): 29 y_max = y + stride*out_h 30 for x in range(filter_w): 31 x_max = x + stride*out_w 32 img[:, :, y:y_max:stride, x:x_max:stride] = col[:, :, y, x, :, :] 33 34 return img[:, :, pad:H + pad, pad:W + pad] 35 36Data = im2col(T1, filter_h = 5, filter_w = 5, stride=1, pad=0) 37#Data.shape = (6452480,25) 38 39Net = np.dot(Data, Filters)- (1/2)*Bias 40sum_Net = np.sum(Net,axis = 1) 41sum_Net = sum_Net.reshape(6452480,-1) 42new_Net = Net/sum_Net 43new_Net = softmax(new_Net) #softmaxの定義については無視してください。 44 45newNetImg = coltoim(new_Net,T1,5,5,1,0) 46#newNetImgを画像として出力したい。
たいへん分かりにくくて申し訳ありません。そもそもcoltoimの定義も間違っているのかもしれませんが、アドバイスをお持ちの方、どうぞよろしくお願いいたします。
あなたの回答
tips
プレビュー