説明文から画像生成の学習データの構造について

テキストの説明から画像生成するモデルを使用する際に
学習データはあらかじめ説明文が入っているのでしょうか。

画像分類や画像生成の学習データとしてよく使われるOxford-102やCUBでは
画像が花や鳥の画像が万枚オーダーでパッケージされたオープンデータセットであると認識しています。

これらのデータセットをつかって説明文から画像生成する場合
データセットにはあらかじめ正解の説明文とそれに一致する画像が
紐付いている必要があると思います。
Oxford-102やCUBではこれらの下処理が既に完了しているのか
知りたいです。

2021/02/11 07:30

Oxford-102やCUBではこれらの下処理が既に完了しているのか知りたいです。 → ダウンロードして中身を見てみたのでしょうか？ https://www.robots.ox.ac.uk/~vgg/data/flowers/102/

2021/02/11 22:50

そうですね。　どのようなデータ構造になっているのか知りたいと思っています。中身を見ることは可能なのでしょうか。

2021/02/11 22:55

中身を見ることが不可能であれば、そもそもデータセットが使えないですよね。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだ回答がついていません

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問