質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2810閲覧

im2colの動作 畳み込みニューラルネットワーク

taichi1602

総合スコア26

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/12/11 06:48

編集2020/12/14 07:33

ゼロから作るDeeplearningにあるim2colを用いて,CNNを実装しているのですが, うまく行かない部分があり質問しました。
CNNは, 入力(チャネル数1, 28×28)→畳み込み層1(フィルタ9×9, ストライド1)→畳み込み層2(フィルタ9×9, ストライド2)→全結合層
各畳み込み層はフィルタ数5枚を想定しています。
入力x[6,1,28,28]は, MNISTを想定して縦横28×28, チャネル数1の白黒画像を6枚用意します。
畳み込み層1では, 9×9のフィルタ5枚をストライド1, パディング0で畳み込み, 5×20×20の特徴マップを作製します。
畳み込み層2では, 9×9のフィルタ5枚をストライド2, パディング0で畳み込み, 5×6×6の特徴マップを作製します。
最期に全結合層での出力を行い, 逆伝搬により重みの修正を行います。

順伝搬のプログラムを実行すると下のエラーが出てしまいます。
ValueError: shapes (216,405) and (81,5) not aligned: 405 (dim 1) != 81 (dim 0)
エラーを回避するためには, 画像を一枚づつとフィルタを1枚ずつforで計算しながらしなければエラー回避できず, それではcol2imのメリットがなくなってしまいます。
下記プログラムの問題はどこにあるのでしょうか?

python

1import numpy as np 2 3def im2col(input_data, filter_h, filter_w, stride_h=1, stride_w=1, pad_h=0, pad_w=0): 4 5 N, C, H, W = input_data.shape 6 out_h = (H + 2*pad_h - filter_h)//stride_h + 1 7 out_w = (W + 2*pad_w - filter_w)//stride_w + 1 8 9 img = np.pad(input_data, [(0,0), (0,0), (pad_h, pad_h), (pad_w, pad_w)], 'constant') 10 col = np.zeros((N, C, filter_h, filter_w, out_h, out_w)) 11 12 for y in range(filter_h): 13 y_max = y + stride_h*out_h 14 for x in range(filter_w): 15 x_max = x + stride_w*out_w 16 col[:, :, y, x, :, :] = img[:, :, y:y_max:stride_h, x:x_max:stride_w] 17 18 col = col.transpose(0, 4, 5, 1, 2, 3).reshape(N*out_h*out_w, -1) 19 return col, out_h, out_w 20 21def col2im(col, input_shape, filter_h, filter_w, stride=1, pad=0): 22 N, C, H, W = input_shape 23 out_h = (H + 2*pad - filter_h)//stride + 1 24 out_w = (W + 2*pad - filter_w)//stride + 1 25 col = col.reshape(N, out_h, out_w, C, filter_h, filter_w).transpose(0, 3, 4, 5, 1, 2) 26 27 img = np.zeros((N, C, H + 2*pad + stride - 1, W + 2*pad + stride - 1)) 28 for y in range(filter_h): 29 y_max = y + stride*out_h 30 for x in range(filter_w): 31 x_max = x + stride*out_w 32 img[:, :, y:y_max:stride, x:x_max:stride] += col[:, :, y, x, :, :] 33 34 return img[:, :, pad:H + pad, pad:W + pad] 35 36#入力 37x = np.arange(6*1*28*28).reshape(6,1,28,28) 38 39#フィルタ 40w = np.arange(5*9*9).reshape(5,9,9) 41 42#入力2次元化 43col_x,out_h,out_w = im2col(x,9,9,1,1,0,0)#入力, フィルタサイズ9, ストライド1 44 45#1層目フィルタ2次元化 46col_w = w.reshape(5,-1).T 47 48#1層目畳み込み計算 49conv1_col = np.dot(col_x, col_w) 50 51#1層目畳み込み層変換 52conv1 = conv1_col.reshape(x.shape[0], out_h, out_w, -1).transpose(0, 3, 2, 1) 53 54 55#2層目フィルタ 56w2 = np.arange(5*9*9).reshape(5,9,9) 57 58#2層目フィルタ2次元化 59col_w2 = w.reshape(5,-1).T 60 61#2層目畳み込み計算(2次元) 62input_col,out_h,out_w = im2col(conv1,9,9,2,2,0,0) 63conv2_col = np.dot(input_col, col_w2) 64conv2 = conv2_col.reshape(conv1.shape[0], out_h, out_w, -1).transpose(0, 3, 2, 1) 65 66#全結合層重み 67w_affine = np.random.rand(6*6*5,10) 68 69#全結合層出力 70z = conv.reshape(-1) 71y = np.dot(z,w_affine) 72

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

2層目フィルタのw2の形状が間違っているみたいです。
2層目は1層目のフィルタ5枚の結果に対してフィルタ5枚を適用するので、5x5x9x9になります。

#2層目フィルタ w2 = np.arange(5*5*9*9).reshape(5,5,9,9) #2層目フィルタ2次元化 col_w2 = w2.reshape(5,-1).T

また、最後の全結合層出力は画像6枚のバッチ処理なので、バッチサイズに合わせてzの形状を変える必要があるかと思います。

#全結合層出力 z = conv2.reshape(conv2.shape[0], -1) y = np.dot(z,w_affine)

投稿2020/12/29 16:53

segavvy

総合スコア1038

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

taichi1602

2020/12/31 08:21

回答ありがとうございます。 w2のフィルタサイズは、5*5*9*9になるのですね。 1層目のフィルタと同じ次元になるものだと勘違いしていました。 フィルタの形状を変えたところうまく動きました。ありがとうございました。
segavvy

2020/12/31 12:50

お役に立てたようでよかったです!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問