質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2759閲覧

CNNの基礎がわからなくなってきました

nouken

総合スコア369

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2018/12/23 09:59

kerasで以下のようなCNNモデルを作りましたが、考えているうちによくわからなくなってきたので質問させてください。

python

1 2model = Sequential() 3 4model.add(Conv2D(filters = 32, kernel_size = (5,5), padding = 'same', activation ='relu', input_shape = (28,28,1))) 5model.add(Conv2D(filters = 32, kernel_size = (5,5), padding = 'same', activation ='relu')) 6model.add(MaxPool2D(pool_size=(2,2))) 7model.add(Dropout(0.25)) 8 9 10model.add(Conv2D(filters = 64, kernel_size = (3,3), padding = 'same', activation ='relu')) 11model.add(Conv2D(filters = 64, kernel_size = (3,3), padding = 'same', activation ='relu')) 12model.add(MaxPool2D(pool_size=(2,2), strides=(2,2))) 13model.add(Dropout(0.25)) 14 15model.add(Flatten()) 16model.add(Dense(256, activation = "relu")) 17model.add(Dropout(0.25)) 18model.add(Dense(10, activation = "softmax")) 19 20 21_________________________________________________________________ 22Layer (type) Output Shape Param # 23================================================================= 24conv2d_1 (Conv2D) (None, 28, 28, 32) 832 25_________________________________________________________________ 26conv2d_2 (Conv2D) (None, 28, 28, 32) 25632 27_________________________________________________________________ 28max_pooling2d_1 (MaxPooling2 (None, 14, 14, 32) 0 29_________________________________________________________________ 30dropout_1 (Dropout) (None, 14, 14, 32) 0 31_________________________________________________________________ 32conv2d_3 (Conv2D) (None, 14, 14, 64) 18496 33_________________________________________________________________ 34conv2d_4 (Conv2D) (None, 14, 14, 64) 36928 35_________________________________________________________________ 36max_pooling2d_2 (MaxPooling2 (None, 7, 7, 64) 0 37_________________________________________________________________ 38dropout_2 (Dropout) (None, 7, 7, 64) 0 39_________________________________________________________________ 40flatten_1 (Flatten) (None, 3136) 0 41_________________________________________________________________ 42dense_1 (Dense) (None, 256) 803072 43_________________________________________________________________ 44dropout_3 (Dropout) (None, 256) 0 45_________________________________________________________________ 46dense_2 (Dense) (None, 10) 2570 47================================================================= 48Total params: 887,530 49Trainable params: 887,530 50Non-trainable params: 0 51_________________________________________________________________

(28, 28, 1)の入力に対し、5×5のフィルター32枚で畳み込み演算をすることで(28, 28, 32)の行列が出力されるところはわかるのですが、その後さらに5×5×32のフィルター32枚で畳み込みをすると、(28, 28, 32×32)といった形状になるのではと思うのですが、(28, 28, 32)となっています。私の考え方のどこが間違っているのか指摘していただけないでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

入力のチャンネル数にかかわらず1枚のフィルタの出力は (OUT_H, OUT_W, 1) です。
例えば、フィルタが32枚あったら、(OUT_H, OUT_W, 32) がその畳込み層の出力です。

イメージ説明

上記が1つのフィルタによる出力の様子

追記

数式で表した場合

イメージ説明

イメージ説明

投稿2018/12/23 10:52

編集2018/12/23 12:23
tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

nouken

2018/12/23 11:09

回答ありがとうございます。チャネル方向に足し合わせるということでしょうか?
tiitoi

2018/12/23 11:19

足し合わせるのではなく、結合したものが次の畳み込み層の入力になります。
nouken

2018/12/23 11:57

例えば(28, 28, 32)の入力に対して、(5, 5, 32)のフィルターでたたみこむと、フィルターが移動する毎に5*5*32の(入力の各要素)と(フィルターの各要素)を掛け合わせたものが出てくると思うのですが、これらは足し合わせて、出力の一つの要素になるのではないのでしょうか?
tiitoi

2018/12/23 12:21

> 出力の一つの要素になるのではないのでしょうか? それは1枚のフィルタが出力の要素1つを計算する際の話です。 結合するといっているのは、フィルタがN枚あったとき、 (OUT_H, OUT_W, 1) の配列がN個出力されるので、これをチャンネル方向に結合して ((OUT_H, OUT_W, N) として畳み込み層全体の出力とするということです。 数式表現を追記しました。
nouken

2018/12/23 15:06

理解できました、ありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問