質問するログイン新規登録

Q&A

0回答

1589閲覧

画像生成 GAN-INTの評価関数について教えて下さい。

watchdogs

総合スコア54

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

データ構造

データ構造とは、データの集まりをコンピュータの中で効果的に扱うために、一定の形式に系統立てて格納する形式を指します。(配列/連想配列/木構造など)

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

0グッド

0クリップ

投稿2021/02/12 07:21

編集2021/02/13 04:15

0

0

GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
GAN-INTの評価関数について理解したので教えて欲しいです。

下記にがGAN-INTの損失関数です。
イメージ説明

下記の論文の内容になります。
リンク内容
内容は4.3に記載されています。

質問
・テキスト補間(第3項)では何をしているのか知りたい
・第3項が追加されたことで式はどの様に影響してくるのか知りたい

添付しています論文にはテキスト補間の目的関数を足したと記載がありましたので
ここに貼り付けた画像の様な式になる様に従来のGANの評価関数の式にテキスト補間の式を足した理解でいます。
ここで理解ができないのが、
画像生成した結果と正解の文章のエンコードされたものをペアで読み込んでいると記載があります。
ここから冒頭の
トレーニングセットの正解の文章のエンコードされたデータの間を補間するだけで、大量の追加のテキスト埋め込みを生成できます。
のところで、
よく理解できていないのですが、

下記の理解で良いのか知りたいです。

ノイズと正解テキストの補間データを比べて
ノイズと正解テキストに無い間をここの式して補間しその結果が第三項の赤枠に入っているという認識で良いのでしょうか。

そうすると、
本来のGANの式であれば、
Dは右辺の第1項と第2項を共に大きくする様な働きを持ちます。
Gは第2項を小さくする様に
働きますが、
第3項が追加されたことでこれらはどの様な働きをするのか理解ができません。
長文で失礼しますが、
よろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.29%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問