質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

1169閲覧

Pythonにおける配列と画像データの変換について

T_Endo

総合スコア5

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/07/31 05:09

編集2020/07/31 05:55

お世話になっております。初めて質問をさせていただく者です。
Deep Learning関連の質問なのですが、非常に優れた関数であるim2colという関数の逆バージョンであるcoltoim関数を実装したいと考えております。
実験の意図としては、画像データとして読み込んだものをim2colによって行列化し、それに以下のコードの演算を加えた後、coltoimによって再び画像化したいと考えています。ただし、演算によって次元の要素が変わってしまうため、上手くいっていない状況です。エラーコードとしては、以下のようなものです。
"cannot reshape array of size 412958720 into shape (1280,71,71,1,5,5)"

以下がソースコードとなります。

Python

1#前提データとして、"T1","Filters","Bias"があります。 2#T1.shape = (画像枚数、チャネル数、画像の縦サイズ、画像の横サイズ) = (1280,1,75,75),Filters.shape = (25,64),Bias.shape = (64,)です。 3 4def im2col(input_data, filter_h, filter_w, stride=1, pad=0): 5 N, C, H, W = input_data.shape 6 out_h = (H + 2*pad - filter_h)//stride + 1 7 out_w = (W + 2*pad - filter_w)//stride + 1 8 9 img = np.pad(input_data, [(0,0), (0,0), (pad, pad), (pad, pad)], 'constant') 10 col = np.zeros((N, C, filter_h, filter_w, out_h, out_w)) 11 12 for y in range(filter_h): 13 y_max = y + stride*out_h 14 for x in range(filter_w): 15 x_max = x + stride*out_w 16 col[:, :, y, x, :, :] = img[:, :, y:y_max:stride, x:x_max:stride] 17 18 col = col.transpose(0, 4, 5, 1, 2, 3).reshape(N*out_h*out_w, -1) 19 return col 20 21def coltoim(col, input_data, filter_h, filter_w, stride=1, pad=0): 22 N, C, H, W = input_data.shape 23 out_h = (H + 2*pad - filter_h)//stride + 1 24 out_w = (W + 2*pad - filter_w)//stride + 1 25 col = col.reshape(N, out_h, out_w, C, filter_h, filter_w).transpose(0, 3, 4, 5, 1, 2) 26 27 img = np.zeros((N, C, H + 2*pad + stride - 1, W + 2*pad + stride - 1)) 28 for y in range(filter_h): 29 y_max = y + stride*out_h 30 for x in range(filter_w): 31 x_max = x + stride*out_w 32 img[:, :, y:y_max:stride, x:x_max:stride] = col[:, :, y, x, :, :] 33 34 return img[:, :, pad:H + pad, pad:W + pad] 35 36Data = im2col(T1, filter_h = 5, filter_w = 5, stride=1, pad=0) 37#Data.shape = (6452480,25) 38 39Net = np.dot(Data, Filters)- (1/2)*Bias 40sum_Net = np.sum(Net,axis = 1) 41sum_Net = sum_Net.reshape(6452480,-1) 42new_Net = Net/sum_Net 43new_Net = softmax(new_Net) #softmaxの定義については無視してください。 44 45newNetImg = coltoim(new_Net,T1,5,5,1,0) 46#newNetImgを画像として出力したい。

たいへん分かりにくくて申し訳ありません。そもそもcoltoimの定義も間違っているのかもしれませんが、アドバイスをお持ちの方、どうぞよろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/07/31 05:32

「上手くいっていない状況」とは何でしょうか?
can110

2020/07/31 05:42

「im2col」関数はどのようなモジュール、パッケージ、ライブラリのものでしょうか? ほかにも閲覧者が知りえないが質問の背景として必要である情報があれば、具体的に記載ください。
T_Endo

2020/07/31 05:56

申し訳ありません。 エラー内容を記述し、im2col関数について追記いたしました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問