前提・実現したいこと
ゼロから作るディープラーニング7章Convolutionの実装のところに出てきた関数im2colのcol.transpose(0, 4, 5, 1, 2, 3).reshape(Nout_hout_w, -1)で軸を入れ替える意味がわからない
該当のソースコード
python
1# 3次元の入力データ(画像データ、※バッチも入れたら4次元)を2次元の行列に変換する関数 2def im2col(input_data, filter_h, filter_w, stride=1, pad=0): 3 N, C, H, W = input_data.shape 4 out_h = (H + 2*pad - filter_h)//stride + 1 5 out_w = (W + 2*pad - filter_w)//stride + 1 6 7 img = np.pad(input_data, [(0,0), (0,0), (pad, pad), (pad, pad)], 'constant') 8 col = np.zeros((N, C, filter_h, filter_w, out_h, out_w)) 9 for y in range(filter_h): 10 y_max = y + stride*out_h 11 for x in range(filter_w): 12 x_max = x + stride*out_w 13 col[:, :, y, x, :, :] = img[:, :, y:y_max:stride, x:x_max:stride] 14 15 # この部分で軸を入れ替える意味がわかりません。 16 col = col.transpose(0, 4, 5, 1, 2, 3).reshape(N*out_h*out_w, -1) 17 18 return col
試したこと
Googleで検索したがわからなかった。
回答1件
あなたの回答
tips
プレビュー