テキストから画像を生成する技術に興味を持っています。
これらはテキストがベクトル化されてGANという機械学習の手法を用いて
画像化されるとざっくりですが勉強しました。
そこで質問は、
テキストがベクトルに変換される際に、どのような処理が間で行われているのか知りたいです。
ざっくりした質問で恐縮ですが、教えて頂けますでしょうか。
また基礎が記載してある論文がもしあれば紹介して頂きたいです。
また、現在下記の記事を読んで勉強しています。
https://www.nogawanogawa.com/entry/stackgan#%E8%AB%96%E6%96%87
下記の文章を理解したいことが本質問の目的です。
"""
平均(μ(φt ))、対角共分散行列(diagonal covariance matrix, Σ(φt))となるガウス分布(N (μ(φt ), Σ(φt )))から無作為に値をサンプリングする。
これにより、多様性を維持することができ、少ない入力テキスト表現から幅広い分布を生成することができる。
"""
よろしくお願い致します。
あなたの回答
tips
プレビュー