CVAEを使った半教師あり学習のプログラムについてです。

Question

http://ralo23.hatenablog.com/entry/2016/08/26/163556
以上のサイトで紹介している手法、プログラムについてです。
https://github.com/rarilurelo/keras-VAE/blob/master/training_m2.pyこちらのソースでm2モデルのトレーニングを行なっていますが、これのインプットの部分について分からないことがあります。
このモデルを定義しているのはhttps://github.com/rarilurelo/keras-VAE/blob/master/vae_m2.pyこのソースの、

```Python
 def training_model(self):
        model = Model(input=[self.x_l, self.y_l, self.x_u]+self.y_u, output=self.reconstruct_x_l)
        return model
```

ここの部分で、インプットの部分をみるとラベル付きのデータとそうでないデータをインプットとしているのがわかります。
そして次にトレーニングのfitの引数のインプットの部分を見て見ます。

```Python
[z1_train]+[y_train]+[z1_train]+y_u_train
```
それぞれshapは以下
z1_train: (60000, 50)
y_train: (60000, 10)
z1_train: (60000, 50)
y_u_train: (60000, 10, 10)

これで定義されたインプットと同じですが、これって半教師あり学習なので教師データのいくつかだけにラベルがついていてあとはついていないデータという事になりますよね？しかしこれだとラベルの付いた60000枚全てのデータと同じデータのラベルが付いていないバージョン60000枚という事になっている気がするのですが、どうでしょうか？なぜこれでラベル付きデータとまたそれとは違ったラベルなしのデータという事になるのでしょうか？

Accepted Answer

ただの実装ミスのように思いますが、何か深遠な理由があるのかもしれません。

機械学習系の「やってみた」は平然と教師データでテストしてたり、モデルが空回しだったりするので、過信は禁物です。

試しにラベルのある範囲を狭めてみてはいかがですか？
うまく学習できるとラベルありが100個でも90%の精度が出るらしいですよ。

関連した質問