質問:CGANの画像、ラベル入力次元数は揃えるべきでしょうか?
CGANは2014年にarXivで公開された論文 Conditional Generative Adversarial Netsで提案された画像生成手法です。
CGANを使ってみようと思いいくつかのWebページを参考にしたのですが、画像・ラベルの入力次元数を揃えるべきかの否かの記述が見つからず有識者の方に質問したいと思います。
CGANでは通常のGANと異なり、入力にN次元の画像ベクトルとM次元のone-hotラベルベクトルをConcatenateで結合して入力します。
ここで、次元数NがMに比べて極端に大きいと、ラベルベクトルが学習に影響せず通常のGANとほぼ同じ結果になるのではないかと考えました。
ラベルと画像を両方学習してもらうにはラベルの次元を拡張してやることが有効なのではないかと思うのですが、調べてみるとそのようにしている方は少数派のようです。
CGANを実装する際のベストな方法はどちらでしょうか?モデル作成の参考にしたいのでご教授いただけると幸いです。
試したこと
以下のサイトを検索しました。
https://jp.mathworks.com/matlabcentral/fileexchange/74921-conditional-gan-generative-adversarial-network-with-mnist
揃えている方↓
https://qiita.com/syaorn_13/items/4abdae6fceecccda5d00
揃えていない方↓
https://qiita.com/kyamada101/items/5195b1b32c60168b1b2f
https://qiita.com/triwave33/items/f6352a40bcfbfdea0476
http://cedro3.com/ai/pytorch-conditional-gan/
あなたの回答
tips
プレビュー