質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

782閲覧

Conv3DとLSTMの組み合わせ方法が分からない

furutti

総合スコア0

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/07/18 08:38

前提・実現したいこと

機械学習初心者で機械学習に関する勉強を行っています。
現在CNNとLSTMを組み合わせた25単語の読唇モデルをkerasで構築しているのですが、インターネット上で色々調べてみても構築方法がよく分かりませんでした。
Conv3D単体では正常に動作して6割程度の認識率を得られるのですが、LSTMと組み合わせた途端に認識率がガクンと落ちてしまいます。
下記のコードで実装方法は問題ないのでしょうか、それともConv3DとLSTMは本来組み合わせるようなものではないのでしょうか。
どなたか詳しい方がおりましたら回答お願いします。

該当のソースコード

X_train = x_train.reshape((x_train.shape[0], IMAGE_SIZE, IMAGE_SIZE, DEPTH_NUM, CHANNEL_NUM)) X_test = x_test.reshape((x_test.shape[0], IMAGE_SIZE, IMAGE_SIZE, DEPTH_NUM, CHANNEL_NUM)) Y_train = np_utils.to_categorical(y_train, WORD_NUM) Y_test = np_utils.to_categorical(y_test, WORD_NUM) X_train = X_train.astype("float32") X_test = X_test.astype("float32") model = Sequential() model.add(Conv3D(32, kernel_size=(3, 3, 3), input_shape=(X_train.shape[1:]), padding="same")) model.add(Activation("relu")) model.add(Conv3D(32, kernel_size=(3, 3, 3), padding="same")) model.add(Activation("softmax")) model.add(MaxPooling3D(pool_size=(3, 3, 3), padding="same")) model.add(Dropout(0.25)) model.add(Conv3D(64, kernel_size=(3, 3, 3), padding="same")) model.add(Activation("relu")) model.add(Conv3D(64, kernel_size=(3, 3, 3), padding="same")) model.add(Activation("softmax")) model.add(MaxPooling3D(pool_size=(3, 3, 3), padding="same")) model.add(Dropout(0.25))

ここから
model.add(Reshape((-1,64)))
model.add(LSTM(256))
ここまでを元のコードに追加しました。
model.add(Flatten())
model.add(Dense(512, activation="sigmoid"))
model.add(Dropout(0.5))
model.add(Dense(WORD_NUM, activation="softmax"))

opt = optimizers.Adam(lr=LEARNING_RATE) model.compile(loss=categorical_crossentropy, optimizer=opt, metrics=["accuracy"]) model.summary() history = model.fit(X_train, Y_train, batch_size=BATCH_SIZE, epochs=EPOCH, validation_data=(X_test, Y_test))

補足情報(FW/ツールのバージョンなど)

Microsoft Visual Studio2017
tensorflow 2.4.1
keras2.4.3
Python 3.6.13

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問