質問編集履歴

1 タイトル修正

joyjoy

joyjoy score 12

2019/07/11 00:00  投稿

InvaliArgumentError: Incompatible shapesの解決方法
【Keras】 InvalidArgumentError: Incompatible shapesのエラーが出ます。
### 前提・実現したいこと
kerasを用いてVAEをCNNを用いて実装を試みました。
データはMNISTを使っています。
実行すると以下のようなエラーメッセージが表示されるのですが、どこが間違えているか特定できません。
### 発生している問題・エラーメッセージ
```
tensorflow.python.framework.errors_impl.InvalidArgumentError: Incompatible sh
apes: [10,28,28] vs. [10]
```
### 該当のソースコード
```Python
from keras.layers import Input, Dense, Conv2D, MaxPooling2D, UpSampling2D, Reshape, Flatten, Lambda
from keras.models import Model
from keras import backend as K
import matplotlib.pyplot as plt
import numpy as np
intermediate_dim = 64
latent_dim = 8
class vae_util:
def build_encoder(self):
input_img = Input(shape=(28, 28, 1))
x = Conv2D(16, (3, 3), activation='relu', padding='same')(input_img)
x = MaxPooling2D((2, 2))(x)
x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)
x = MaxPooling2D((2, 2))(x)
# (7, 7, 8)
x = Flatten()(x)
hidden = Dense(intermediate_dim, activation='relu')(x)
z_mean = Dense(latent_dim, activation='linear')(hidden)
z_log_var = Dense(latent_dim, activation='linear')(hidden)
return Model(input_img, [z_mean, z_log_var])
def build_sampler(self):
z_mean = Input(shape=(latent_dim, ))
z_log_var = Input(shape=(latent_dim, ))
z = Lambda(self.sampling, output_shape=(latent_dim, ))([z_mean, z_log_var])
return Model([z_mean, z_log_var], z)
def build_decoder(self):
z = Input(shape=(latent_dim, ))
x = Dense(intermediate_dim, activation='relu')(z)
x = Dense(7*7*8, activation='relu')(x)
x = Reshape((7, 7, 8))(x)
x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)
x = UpSampling2D((2, 2))(x)
x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)
x = UpSampling2D((2, 2))(x)
decoded = Conv2D(1, (3, 3), activation='sigmoid', padding='same')(x)
return Model(z, decoded)
def sampling(self, args):
z_mean, z_log_var = args
epsilon = np.random.normal(size=latent_dim)
return z_mean + K.sqrt(K.exp(z_log_var)) * epsilon
def build_vae(self, encoder, sampler, decoder):
_, conv1, maxp1, conv2, maxp2, flat, dense1, encoder_mean, encoder_log_var = encoder.layers
input_img = Input(shape=(28, 28, 1))
x = conv1(input_img)
x = maxp1(x)
x = conv2(x)
x = maxp2(x)
x = flat(x)
x = dense1(x)
z_mean = encoder_mean(x)
z_log_var = encoder_log_var(x)
self.z_m = z_mean
self.z_s = z_log_var
_, _, sampler_lambda = sampler.layers
z = sampler_lambda([z_mean, z_log_var])
_, dense2, dense3, reshape1, conv3, upsampling1, conv4, upsampling2, conv5 = decoder.layers
x = dense2(z)
x = dense3(x)
x = reshape1(x)
x = conv3(x)
x = upsampling1(x)
x = conv4(x)
x = upsampling2(x)
decoded = conv5(x)
return Model(input_img, decoded)
def binary_crossentropy(self, y_true, y_pred):
return K.sum(K.binary_crossentropy(y_pred, y_true), axis=-1)
def vae_loss(self, x, x_decoded_mean):
z_mean = self.z_m
z_log_var = self.z_s
# Reconstruction loss
rc_loss = K.sum(K.binary_crossentropy(x, x_decoded_mean), axis=-1)
# Regularization term (KL divergence)
kl_loss = -0.5 * K.sum(1 + z_log_var \
- K.square(z_mean) \
- K.exp(z_log_var), axis=-1)
# Average over mini-batch
return K.mean(rc_loss + kl_loss)
def model_compile(self, model):
model.compile(optimizer='adam', loss=self.vae_loss)
from keras.datasets import mnist
import numpy as np
(x_train, _), (x_test, _) = mnist.load_data()
x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
x_train = x_train[:, :, :, np.newaxis]
x_test = x_test[:, :, :, np.newaxis]
v = vae_util()
encoder = v.build_encoder()
sampler = v.build_sampler()
decoder = v.build_decoder()
vae= v.build_vae(encoder, sampler, decoder)
v.model_compile(vae)
epochs = 30
result = vae.fit(x_train, x_train,
epochs=epochs,
batch_size=10,
shuffle=True,
validation_data=(x_test, x_test))
```
### 試したこと
エラー文の10と28はそれぞれバッチサイズと画像の縦と横のピクセル数ということは分かるのですが、どこが間違えているか分かりません。ちなみにバッチサイズが1のときはエラーは発生しません。
よろしくお願いします。
  • Python

    24964 questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Keras

    1149 questions

    Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る