質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

フィルタ

フィルタとは、特定の条件に合わせてデータへのアクセスをブロックするプログラムやルーチンを指します。

コードレビュー

コードレビューは、ソフトウェア開発の一工程で、 ソースコードの検査を行い、開発工程で見過ごされた誤りを検出する事で、 ソフトウェア品質を高めるためのものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

解決済

Maxpoolingを行わずにconvolutionのみでダウンサンプリングを行いたい。

1999si
1999si

総合スコア0

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

フィルタ

フィルタとは、特定の条件に合わせてデータへのアクセスをブロックするプログラムやルーチンを指します。

コードレビュー

コードレビューは、ソフトウェア開発の一工程で、 ソースコードの検査を行い、開発工程で見過ごされた誤りを検出する事で、 ソフトウェア品質を高めるためのものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0評価

0クリップ

413閲覧

投稿2021/10/07 06:48

編集2021/10/08 03:05

前提・実現したいこと

python初心者です。
kerasでMaxpooling(フィルタサイズ2×2)を行わずにconvolution(畳み込み層)のフィルタサイズ(カーネルサイズ)=3×3、ストライド=2とすることで画像情報を半減させたいです。
具体的にはU-Netを用いて入力画像180×180→90×90→45×45→90×90→180×180というようにダウンサンプリング、アップサンプリングを行いたいです。

尚、convolution層でのフィルタサイズ=3×3、ストライド=1とした場合は正常に動作しますが、フィルタサイズを上記のように変更したところエラーが発生します。

発生している問題・エラーメッセージ

ValueError: `Concatenate` layer requires inputs with matching shapes except for the concat axis. Got inputs shapes: [(None, 2, 2, 128), (None, 3, 3, 64)]

該当のソースコード

python

#スライス画像をゼロパディングする→元画像のshape(49, 180, 180, 1)から(49, 182, 182, 1)に変更されていることを確認 train_a_slisepadding=np.pad(train_a_slice,((0,0),(1,1),(1,1),(0,0)),'constant') train_b_slisepadding=np.pad(train_b_slice,((0,0),(1,1),(1,1),(0,0)),'constant') def network_unet_simple3(): input_img = Input(shape=(IMAGE_SIZE, IMAGE_SIZE,1)) enc1 = Conv2D(32, kernel_size=3, strides=2, activation="relu", padding="same")(input_img) enc1 = BatchNormalization()(enc1) enc1 = Conv2D(32, kernel_size=3, strides=2, activation="relu", padding="same")(enc1) enc1 = BatchNormalization()(enc1) enc1 = Conv2D(32, kernel_size=3, strides=2, activation="relu", padding="same")(enc1) enc1 = BatchNormalization()(enc1) enc2 = Conv2D(64, kernel_size=3, strides=2, activation="relu", padding="same")(enc1) enc2 = BatchNormalization()(enc2) enc2 = Conv2D(64, kernel_size=3, strides=2, activation="relu", padding="same")(enc2) enc2 = BatchNormalization()(enc2) enc2 = Conv2D(64, kernel_size=3, strides=2, activation="relu", padding="same")(enc2) enc2 = BatchNormalization()(enc2) enc3 = Conv2D(128, kernel_size=3, strides=2, activation="relu", padding="same")(enc2) enc3 = BatchNormalization()(enc3) enc3 = Conv2D(128, kernel_size=3, strides=2, activation="relu", padding="same")(enc3) enc3 = BatchNormalization()(enc3) enc3 = Conv2D(128, kernel_size=3, strides=2, activation="relu", padding="same")(enc3) enc3 = BatchNormalization()(enc3) enc3 = Conv2D(128, kernel_size=3, strides=2, activation="relu", padding="same")(enc3) enc3 = BatchNormalization()(enc3) up2 = UpSampling2D(size=2)(enc3) dec2 = concatenate([up2, enc2], axis=2) dec2 = Conv2D(64, kernel_size=3, strides=2, activation="relu", padding="same")(dec2) dec2 = BatchNormalization()(dec2) dec2 = Conv2D(64, kernel_size=3, strides=2, activation="relu", padding="same")(dec2) dec2 = BatchNormalization()(dec2) dec2 = Conv2D(64, kernel_size=3, strides=2, activation="relu", padding="same")(dec2) dec2 = BatchNormalization()(dec2) up1 = UpSampling2D(size=2)(dec2) dec1 = concatenate([up1, enc1], axis=2) dec1 = Conv2D(32, kernel_size=3, strides=2, activation="relu", padding="same")(dec1) dec1 = BatchNormalization()(dec1) dec1 = Conv2D(32, kernel_size=3, strides=2, activation="relu", padding="same")(dec1) dec1 = BatchNormalization()(dec1) dec1 = Conv2D(32, kernel_size=3, strides=2, activation="relu", padding="same")(dec1) dec1 = BatchNormalization()(dec1) dec1 = Conv2D(1, kernel_size=1, strides=1, activation="sigmoid", padding="same")(dec1) model = Model(input=input_img, output=dec1) return model model = network_unet_simple3() # ネットワークを表示 print(model.summary()) #通常のU-Netは以下のような構造をしていますので別途記載しておきます。 # def network_unet_simple3(): # input_img = Input(shape=(IMAGE_SIZE, IMAGE_SIZE,1)) # enc1 = Conv2D(32, kernel_size=3, strides=1, activation="relu", padding="same")(input_img) # enc1 = BatchNormalization()(enc1) # enc1 = Conv2D(32, kernel_size=3, strides=1, activation="relu", padding="same")(enc1) # enc1 = BatchNormalization()(enc1) # enc1 = Conv2D(32, kernel_size=3, strides=1, activation="relu", padding="same")(enc1) # enc1 = BatchNormalization()(enc1) # down1 = MaxPooling2D(pool_size=2, strides=2)(enc1) # enc2 = Conv2D(64, kernel_size=3, strides=1, activation="relu", padding="same")(down1) # enc2 = BatchNormalization()(enc2) # enc2 = Conv2D(64, kernel_size=3, strides=1, activation="relu", padding="same")(enc2) # enc2 = BatchNormalization()(enc2) # enc2 = Conv2D(64, kernel_size=3, strides=1, activation="relu", padding="same")(enc2) # enc2 = BatchNormalization()(enc2) # down2 = MaxPooling2D(pool_size=2, strides=2)(enc2) # enc3 = Conv2D(128, kernel_size=3, strides=1, activation="relu", padding="same")(down2) # enc3 = BatchNormalization()(enc3) # enc3 = Conv2D(128, kernel_size=3, strides=1, activation="relu", padding="same")(enc3) # enc3 = BatchNormalization()(enc3) # enc3 = Conv2D(128, kernel_size=3, strides=1, activation="relu", padding="same")(enc3) # enc3 = BatchNormalization()(enc3) # enc3 = Conv2D(128, kernel_size=3, strides=1, activation="relu", padding="same")(enc3) # enc3 = BatchNormalization()(enc3) # up2 = UpSampling2D(size=2)(enc3) # dec2 = concatenate([up2, enc2], axis=-1) # dec2 = Conv2D(64, kernel_size=3, strides=1, activation="relu", padding="same")(dec2) # dec2 = BatchNormalization()(dec2) # dec2 = Conv2D(64, kernel_size=3, strides=1, activation="relu", padding="same")(dec2) # dec2 = BatchNormalization()(dec2) # dec2 = Conv2D(64, kernel_size=3, strides=1, activation="relu", padding="same")(dec2) # dec2 = BatchNormalization()(dec2) # up1 = UpSampling2D(size=2)(dec2) # dec1 = concatenate([up1, enc1], axis=-1) # dec1 = Conv2D(32, kernel_size=3, strides=1, activation="relu", padding="same")(dec1) # dec1 = BatchNormalization()(dec1) # dec1 = Conv2D(32, kernel_size=3, strides=1, activation="relu", padding="same")(dec1) # dec1 = BatchNormalization()(dec1) # dec1 = Conv2D(32, kernel_size=3, strides=1, activation="relu", padding="same")(dec1) # dec1 = BatchNormalization()(dec1) # dec1 = Conv2D(1, kernel_size=1, strides=1, activation="sigmoid", padding="same")(dec1) # model = Model(input=input_img, output=dec1) # return model # model = network_unet_simple3()

試したこと

サイトでは「各種のディープラーニングフレームワークでは、Convolutionのパディング方式として"SAME"モードが指定できると思いますが、ナイーブにこれを使うと、ダウンサンプリング層のたびに受容領域の位置が出力に対してずれていくという問題があります。ダウンサンプリングの回数を予め考慮してはじめにパディングをしてしまうことで、簡単に解消できます。」と書かれていたため、入力画像にあらかじめゼロパディングを行いましたが、結果は変わらず上記に示すエラーとなりました。そもそものパディングのコードが違うのかそれとも原因は別にあるのかすらも検討もつかない状況です。どなたか教えていただければ幸いです。よろしくお願いいたします。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

フィルタ

フィルタとは、特定の条件に合わせてデータへのアクセスをブロックするプログラムやルーチンを指します。

コードレビュー

コードレビューは、ソフトウェア開発の一工程で、 ソースコードの検査を行い、開発工程で見過ごされた誤りを検出する事で、 ソフトウェア品質を高めるためのものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。