Keras でオートエンコーダの事前学習を行う手順とモデルまたは損失関数の改良案

###前提

オートエンコーダで事前学習を行った後、学習したモデルの一部と重みを使って回帰分析のための深層学習を行いたいと考えています。

（以下のイメージ、手順･･･、そもそもこれで合っているか？）

MNISTなどの画像の入出力を行うオートエンコーダについては色々紹介されていますが、回帰分析を前提とした事前学習のためのオートエンコーダについては中々事例が見つからず、こちらで質問をさせていただきます。

###実現したいこと

　　・図のような名前で Dense にレイヤー名をつける
・1. 2. の順で学習を行い、重みを保存する
・3. で 2. までの重みデータを使い、最後を1つのノードにつないで回帰分析を行う(活性化関数なし)

図1.のモデルでは Input ～ Output まで学習するだけなので問題なく、
図2.のモデルでは encode1 までは重みを固定して学習しないように

・図1.＆2.のモデルで同じレイヤーに同じ名前をつける(name = 'enc_1'など)
・図2. のモデルで図1. でも作ったレイヤーは学習を禁止する(trainable = False)

としました。

(以下のコードの様に)

Python
1
2# AutoEncoder 1
3input_ = Input(shape = (input_size, ))
4encoded = input_
5
6e = Dense(dense_size_AE11, activation = AF, kernel_initializer = kinit, name = 'enc_1')(encoded)
7
8decoded = Dense(input_size, activation = None, name = 'dec_2')(e)
9output_ = decoded
10
11model = Model(input_, output_)
12
13encoder = Model(input_, encoded)
14decoder = Model(input_, decoded)
15
16(中略)
17
18# AutoEncoder 2
19input_ = Input(shape = (input_size, ))
20encoded = Dense(dense_size_AE11, trainable = False, name = 'enc_1')(input_)
21e = Dense(dense_size_AE12, activation = AF, kernel_initializer = kinit, name = 'enc_2')(encoded)
22
23decoded = Dense(dense_size_AE11, activation = AF, kernel_initializer = kinit, name = 'dec_1')(e)
24output_ = Dense(input_size, activation = None, trainable = False,name = 'dec_2')(decoded)
25
26model = Model(input_, output_)
27
28encoder = Model(input_, encoded)
29decoder = Model(input_, decoded)
30

なお、input からノード数が減るところまでを encoder として、
同じく output までを decoder として別途定義して、モデルを3種類作成しています。

ここまでは良かったのですが、結果的に、図2. のモデルの学習で躓きました。
上記のやり方で学習を行うと 1. の損失関数は順調に良くなるのですが、
図2. の学習では損失関数が一向に良くならないため、原因を考えました。

###試したこと

回帰分析のため、損失関数には mse を使いました。

図1. のモデルは encoder + decoder = model になるので無事学習できたのだと思います。

一方図2. のモデルは凍結レイヤーを含んでいるため
mse の計算は下図で言うと input と output の差から計算するものだと思いますが、
encode1 ~ encode2 ~ decode1 と訓練するなら encode1 と decode1 の差が必要で、
当然 input ≠ encode1 だし、decode1 ≠ output となるため、
図1.のモデルと同じように普通に mse 最小となるよう学習してもうまくいかないのではないか、
と考えました。

要は図2. の右側のように凍結レイヤーがない状態で mse を計算しないといけないと思ったので、

Python
1ae_hist = model.fit(encoder.predict(X_train), decoder.predict(X_train), batch_size = BATCH_SIZE,
2                    initial_epoch = INITIAL, epochs = EPOCHS,
3                    validation_data = (encoder.predict(X_val), decoder.predict(X_val))
4
5'''
6元々は以下のように学習していたものを train と val を上記の様に変更した
7hist = model.fit(X_train, y_train, batch_size = BATCH_SIZE, initial_epoch = INITIAL,
8                 epochs = EPOCHS, validation_data = (X_val, y_val))
9'''
10

として学習したところ、以下のようなエラーが出ました。

ValueError: Error when checking input: expected input_2 to have shape (8,) but got array with shape (6,)

試した内容に無理があったので、エラーが出る原因はすぐにわかりました。
encoder.predict(X_train) としてしまうと、Input のデータのノード数が変わるからなので
この方法は諦めようと思っています。

他に図2. の学習ができるような損失関数の定義、もしくはモデルの構築方法はないでしょうか？

###環境
Python 3.6.8
keras 2.2.4
tensorflow 1.13.1

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

Keras でオートエンコーダの事前学習を行う手順とモデルまたは損失関数の改良案

関連した質問