学習による画像生成について

前提・実現したいこと

Kerasを使用して画像のr,g,b値を予測しbmp画像を生成するということをしたいです。
たとえば、

のように、元の学習データに類似した画像を生成するのではなく、ある画像をもとに新たに画像を予測し生成する、といった形です。

bmp画像の大きさは元データ・予測データすべて等しく、サイズ149 x 115です。

試したこと

Kerasの回帰分析を使いbmpのRGBの値から新たにRGBの値を予測し、その値からbmp画像を生成する、といったことをしました。
しかし学習データの要素数が多すぎるのか、まったくヘンテコな値しか予測されませんでした。
そこで、この前質問した際にCNNの利用を勧められ、色々見てみたのですが
トレーニングデータに似ている画像を生成する例はたくさんあるけどある画像から新たに画像を予測生成する例が見つかりませんでした。

発生している問題

~~GANやCNNを利用するとよさそうなのはわかるのですが、どう画像を予測し生成するのかまず手法がわかりません…。~~
DCGANのタスクだと教えていただいたので調べて
https://spjai.com/pix2pix-image-generation/
こちらを参考にやってみたのですが、

AssertionError: Height in the output should be positive.

このようなエラーが出てきます…。

補足情報（FW/ツールのバージョンなど）

python 3.6.6のspyderを使用してます。
どなたかよろしくお願いします…。

quickquip

2019/01/08 01:07

「学習データ・テストデータ・予測データ」という書き方に違和感がありました。「元データと予測データのペア」が何組もあって、その大部分を学習データに、一部をテストデータとして使っているということで合ってますか?

quickquip

2019/01/08 01:07

あとすごく素朴な疑問として、このタスクは視覚的に人間が理解できるんでしょうか? つまりペアを5組ぐらい用意して、元データのかたまりと予測データのかたまりをそれぞれシャッフルしたとして、人間はそれを見て元のペアに戻せるんでしょうか。

Shouka

2019/01/08 05:06

>「学習データ・テストデータ・予測データ」という書き方に違和感がありました。すいません、元データと予測（正解）データの大部分を学習データ、一部をテストデータという認識で合っています。 >このタスクは視覚的に人間が理解できるんでしょうか? 人間はスペクトログラムの画像を見てもそこから音声として認識できないので、元のペアに戻せないと思います。

tiitoi

2019/01/08 05:28

> トレーニングデータに似ている画像を生成する例はたくさんあるけどある画像から新たに画像を予測生成する例が見つかりませんでした。典型的な GAN のタスクに思えます。 DCGAN などで調べてください。

quickquip

2019/01/08 05:30

だとすると質問の「ヘンテコな値しか予測されませんでした」の部分はどういう意味になりますか? 十分に見慣れていれば「正解データからは遠い」という程度は判断出来るということでしょうか。

Shouka

2019/01/08 09:02 編集

tiitoiさん >DCGAN などで調べてください。まさにこれでした。ありがとうございます。しかしどう自前のデータセットで学習させるのかがわかりません…。線画からカラー画像を生成するものや、ドット絵と写真のペアを学習させ任意のドット絵から写真を生成するものなどの関連記事は出てきましたが、それらのコードを参考にしてもエラーを吐かれてしまいます…。

Shouka

2019/01/08 09:05

quiquiさん >質問の「ヘンテコな値しか予測されませんでした」の部分はどういう意味になりますか? 0～256のRGB値を予測したいのですが明らかに超えていたりマイナス値になっていたのでそう判断しました。

tiitoi

2019/01/08 09:12 編集

> 線画からカラー画像を生成するものや、ドット絵と写真のペアを学習させ任意のドット絵から写真を生成するものまず MNIST 等の簡単な題材で、画像を生成する DCGAN を実装して理解してから、ご自身の問題に応用されてはどうでしょうか。以下の記事など参考になるかと思います。 https://elix-tech.github.io/ja/2017/02/06/gan.html

Shouka

2019/01/08 09:19

tiitoiさん > MNIST 等の簡単な題材 MNISTは画像を学習させた後まっさらな状態から画像を新たに生成していると思うのですが、パラメータからいきなり画像を生成するのではなく、画像から画像を生成するモデルを構築したいです。その構築方法が分かりません。何度も返信ありがとうございます。すいません、助かります。

tiitoi

2019/01/08 09:43

回答に書きましたが、pix2pix が一番近いと思います。まず仕組みや実装方法に理解してからでないと、ネット上のコードをコピペしても形状が違うとかエラーで怒られてて動かないと思うので、MNIST 等簡単な問題から取り組むのをおすすめします。