🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1936閲覧

im2colのアルゴリズムについて

teefpc

総合スコア112

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/09/28 08:06

編集2019/09/28 11:49

Numpyを使ったim2colのアルゴリズムで分からない部分があります。
以下のコードで、
col[:, :, y, x, :, :] = img[:, :, y:y_max:stride, x:x_max:stride]
という行があるのですが、これが具体的にどんな処理を行っているのか、そしてVisual Basicや、JavaScriptのFor loopで書くとどんなコードになるのか知りたいです。宜しくお願い致します。

引用
リンク内容

Python3

1import numpy as np 2 3def im2col(input_data, filter_h, filter_w, stride=1, pad=0): 4 N, C, H, W = input_data.shape 5 out_h = (H + 2*pad - filter_h)//stride + 1 6 out_w = (W + 2*pad - filter_w)//stride + 1 7 8 img = np.pad(input_data, [(0,0), (0,0), (pad, pad), (pad, pad)], 'constant') 9 col = np.zeros((N, C, filter_h, filter_w, out_h, out_w)) 10 11 for y in range(filter_h): 12 y_max = y + stride*out_h 13 for x in range(filter_w): 14 x_max = x + stride*out_w 15 16 # この行をFor Loopで実装したい 17 col[:, :, y, x, :, :] = img[:, :, y:y_max:stride, x:x_max:stride] 18 19 20 print("Result 1 --------------------------------") 21 print(col) 22 23 col = col.transpose(0, 4, 5, 1, 2, 3) 24 print("Result 2 --------------------------------") 25 print(col) 26 27 col = col.reshape(N*out_h*out_w, -1) 28 print("Result 3 --------------------------------") 29 print(col) 30 31 #return col 32 33x= [ 34 [1,2,3,4], 35 [5,6,7,8], 36 [9,10,11,12], 37 [13,14,15,16] 38 ] 39x= np.array([[x]]) 40 41im2col(x,3,3,stride=1,pad=0) 42 43

#実行結果

Python3

1Result 1 -------------------------------- 2[[[[[[ 1. 2.] 3 [ 5. 6.]] 4 5 [[ 2. 3.] 6 [ 6. 7.]] 7 8 [[ 3. 4.] 9 [ 7. 8.]]] 10 11 12 [[[ 5. 6.] 13 [ 9. 10.]] 14 15 [[ 6. 7.] 16 [ 10. 11.]] 17 18 [[ 7. 8.] 19 [ 11. 12.]]] 20 21 22 [[[ 9. 10.] 23 [ 13. 14.]] 24 25 [[ 10. 11.] 26 [ 14. 15.]] 27 28 [[ 11. 12.] 29 [ 15. 16.]]]]]] 30Result 2 -------------------------------- 31[[[[[[ 1. 2. 3.] 32 [ 5. 6. 7.] 33 [ 9. 10. 11.]]] 34 35 36 [[[ 2. 3. 4.] 37 [ 6. 7. 8.] 38 [ 10. 11. 12.]]]] 39 40 41 42 [[[[ 5. 6. 7.] 43 [ 9. 10. 11.] 44 [ 13. 14. 15.]]] 45 46 47 [[[ 6. 7. 8.] 48 [ 10. 11. 12.] 49 [ 14. 15. 16.]]]]]] 50Result 3 -------------------------------- 51[[ 1. 2. 3. 5. 6. 7. 9. 10. 11.] 52 [ 2. 3. 4. 6. 7. 8. 10. 11. 12.] 53 [ 5. 6. 7. 9. 10. 11. 13. 14. 15.] 54 [ 6. 7. 8. 10. 11. 12. 14. 15. 16.]]

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2019/09/28 08:29

掲載のコードはご自身で書かれたものではないということですか? 引用元は何でしょうか?
guest

回答1

0

ベストアンサー

NumPy配列のスライス表現については下記サイトが参考になるかと思います。

NumPy配列ndarrayのスライスによる部分配列の選択と代入

「y:y_max:stride」なら、yからy_max-1までの間でstride毎の値 となります。
「:」は全部を表します。

colの対象の各次元に対してループ処理をすれば良いでしょう。

投稿2019/09/28 12:18

meg_

総合スコア10736

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

teefpc

2019/09/28 12:31

ありがとうございました。
teefpc

2019/09/28 13:16

col[:, :, y, x, :, :] = img[:, :, y:y_max:stride, x:x_max:stride] の部分についてですが、左辺と右辺の次元が合っていませんが、これはどのように実装すべきでしょうか。
meg_

2019/09/28 13:39

numpyのブロードキャストかと思われます。具体的な数値についてはデバッグして確かめるか、書籍に解説がないか確認してみてください。 参考サイト[DeepAge]:https://deepage.net/features/numpy-broadcasting.html
teefpc

2019/09/28 13:54

ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問