質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.40%

  • Python

    12796questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Keras

    543questions

【Keras】 InvalidArgumentError: Incompatible shapesのエラーが出ます。

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 46

joyjoy

score 0

前提・実現したいこと

kerasを用いてVAEをCNNを用いて実装を試みました。
データはMNISTを使っています。
実行すると以下のようなエラーメッセージが表示されるのですが、どこが間違えているか特定できません。

発生している問題・エラーメッセージ

tensorflow.python.framework.errors_impl.InvalidArgumentError: Incompatible sh
apes: [10,28,28] vs. [10]

該当のソースコード

from keras.layers import Input, Dense, Conv2D, MaxPooling2D, UpSampling2D, Reshape, Flatten, Lambda
from keras.models import Model
from keras import backend as K
import matplotlib.pyplot as plt
import numpy as np

intermediate_dim = 64
latent_dim = 8

class vae_util:

    def build_encoder(self):
        input_img  = Input(shape=(28, 28, 1)) 
        x = Conv2D(16, (3, 3), activation='relu', padding='same')(input_img)
        x = MaxPooling2D((2, 2))(x)
        x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)
        x = MaxPooling2D((2, 2))(x)
        # (7, 7, 8)
        x = Flatten()(x)
        hidden = Dense(intermediate_dim, activation='relu')(x)
        z_mean = Dense(latent_dim, activation='linear')(hidden)
        z_log_var = Dense(latent_dim, activation='linear')(hidden)
        return Model(input_img, [z_mean, z_log_var])

    def build_sampler(self):
        z_mean = Input(shape=(latent_dim, ))
        z_log_var = Input(shape=(latent_dim, ))
        z = Lambda(self.sampling, output_shape=(latent_dim, ))([z_mean, z_log_var])
        return Model([z_mean, z_log_var], z)

    def build_decoder(self):
        z = Input(shape=(latent_dim, ))
        x = Dense(intermediate_dim, activation='relu')(z)
        x = Dense(7*7*8, activation='relu')(x)
        x = Reshape((7, 7, 8))(x)
        x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)
        x = UpSampling2D((2, 2))(x)
        x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)
        x = UpSampling2D((2, 2))(x)
        decoded = Conv2D(1, (3, 3), activation='sigmoid', padding='same')(x)
        return Model(z, decoded)

    def sampling(self, args):
        z_mean, z_log_var = args
        epsilon = np.random.normal(size=latent_dim)
        return z_mean + K.sqrt(K.exp(z_log_var)) * epsilon

    def build_vae(self, encoder, sampler, decoder):
        _, conv1, maxp1, conv2, maxp2, flat, dense1, encoder_mean, encoder_log_var = encoder.layers

        input_img = Input(shape=(28, 28, 1))
        x = conv1(input_img)
        x = maxp1(x)
        x = conv2(x)
        x = maxp2(x)
        x = flat(x)
        x = dense1(x)
        z_mean = encoder_mean(x)
        z_log_var = encoder_log_var(x)

        self.z_m = z_mean 
        self.z_s = z_log_var 

        _, _, sampler_lambda = sampler.layers
        z = sampler_lambda([z_mean, z_log_var])

        _, dense2, dense3, reshape1, conv3, upsampling1, conv4, upsampling2, conv5 = decoder.layers

        x = dense2(z)
        x = dense3(x)
        x = reshape1(x)
        x = conv3(x)
        x = upsampling1(x)
        x = conv4(x)
        x = upsampling2(x)
        decoded = conv5(x)

        return Model(input_img, decoded)

    def binary_crossentropy(self, y_true, y_pred):
        return K.sum(K.binary_crossentropy(y_pred, y_true), axis=-1)


    def vae_loss(self, x, x_decoded_mean):
        z_mean = self.z_m
        z_log_var = self.z_s


        # Reconstruction loss
        rc_loss = K.sum(K.binary_crossentropy(x, x_decoded_mean), axis=-1)

        # Regularization term (KL divergence)
        kl_loss = -0.5 * K.sum(1 + z_log_var \
                                 - K.square(z_mean) \
                                 - K.exp(z_log_var), axis=-1)

        # Average over mini-batch
        return K.mean(rc_loss + kl_loss)



    def model_compile(self, model):
        model.compile(optimizer='adam', loss=self.vae_loss)

from keras.datasets import mnist
import numpy as np

(x_train, _), (x_test, _) = mnist.load_data()

x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
x_train = x_train[:, :, :, np.newaxis]
x_test = x_test[:, :, :, np.newaxis]

v = vae_util()
encoder = v.build_encoder()
sampler = v.build_sampler()
decoder = v.build_decoder()
vae= v.build_vae(encoder, sampler, decoder)
v.model_compile(vae)

epochs = 30
result = vae.fit(x_train, x_train,
                epochs=epochs,
                batch_size=10,
                shuffle=True,
                validation_data=(x_test, x_test))

試したこと

エラー文の10と28はそれぞれバッチサイズと画像の縦と横のピクセル数ということは分かるのですが、どこが間違えているか分かりません。ちなみにバッチサイズが1のときはエラーは発生しません。
よろしくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

check解決した方法

0

損失関数の定義を変更したら問題なく動きました。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.40%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Python

    12796questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Keras

    543questions