テキストの説明から画像生成するモデルを使用する際に
学習データはあらかじめ説明文が入っているのでしょうか。
画像分類や画像生成の学習データとしてよく使われるOxford-102やCUBでは
画像が花や鳥の画像が万枚オーダーでパッケージされたオープンデータセットであると認識しています。
これらのデータセットをつかって説明文から画像生成する場合
データセットにはあらかじめ正解の説明文とそれに一致する画像が
紐付いている必要があると思います。
Oxford-102やCUBではこれらの下処理が既に完了しているのか
知りたいです。
あなたの回答
tips
プレビュー