編集履歴

質問編集履歴

タイトル修正

2021/02/13 04:15

投稿

スコア54

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- GAN-INTの評価関数について教えて下さい。
1	+ 画像生成　GAN-INTの評価関数について教えて下さい。

body CHANGED Viewed

File without changes

質問を修正しました。

2021/02/13 04:15

投稿

watchdogs

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,15 +1,39 @@
 GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
 GAN-INTの評価関数について理解したので教えて欲しいです。
+下記にがGAN－INTの損失関数です。
+![イメージ説明](4f6c652135810bc7a23fe79284695c87.png)
 下記の論文の内容になります。
 [リンク内容](https://arxiv.org/pdf/1605.05396.pdf)
+内容は4.3に記載されています。
-下記にがGAN－INTの損失関数です。
-![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
+質問
+・テキスト補間（第3項）では何をしているのか知りたい
+・第3項が追加されたことで式はどの様に影響してくるのか知りたい
-実際にt1t2がなにを示しているのかわかりません。
-GAN-INTについて理解したので教えて頂けますでしょうか。
+添付しています論文にはテキスト補間の目的関数を足したと記載がありましたので
+ここに貼り付けた画像の様な式になる様に従来のGANの評価関数の式にテキスト補間の式を足した理解でいます。
+ここで理解ができないのが、
+画像生成した結果と正解の文章のエンコードされたものをペアで読み込んでいると記載があります。
+ここから冒頭の
+トレーニングセットの正解の文章のエンコードされたデータの間を補間するだけで、大量の追加のテキスト埋め込みを生成できます。
+のところで、
+よく理解できていないのですが、
+下記の理解で良いのか知りたいです。
+ノイズと正解テキストの補間データを比べて
+ノイズと正解テキストに無い間をここの式して補間しその結果が第三項の赤枠に入っているという認識で良いのでしょうか。
+そうすると、
+本来のGANの式であれば、
+Dは右辺の第１項と第２項を共に大きくする様な働きを持ちます。
+Gは第2項を小さくする様に
+働きますが、
+第3項が追加されたことでこれらはどの様な働きをするのか理解ができません。
+長文で失礼しますが、
 よろしくお願い致します。

修正

2021/02/13 04:14

投稿

watchdogs

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -8,10 +8,8 @@
 ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
-式では生成した結果のｚにt1t2を加えています。
-それはDに生成した画像で得られたzノイズとt1t2の間の値が入ることはわかるのですが、
 実際にt1t2がなにを示しているのかわかりません。
-GAN-INTはが何をしているのか論文を読んでもわかりません。
 GAN-INTについて理解したので教えて頂けますでしょうか。
 よろしくお願い致します。

修正

2021/02/12 11:41

投稿

watchdogs

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -8,11 +8,10 @@
 ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
-本件では、画像とその画像に一致する説明が正解データとして与えられます。
+式では生成した結果のｚにt1t2を加えています。
-式を見るとDにzノイズとt1t2の間の値が入ることはわかるのですが、
+それはDに生成した画像で得られたzノイズとt1t2の間の値が入ることはわかるのですが、
 実際にt1t2がなにを示しているのかわかりません。
+GAN-INTはが何をしているのか論文を読んでもわかりません。
 GAN-INTについて理解したので教えて頂けますでしょうか。
 よろしくお願い致します。

修正

2021/02/12 10:08

投稿

watchdogs

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -9,7 +9,7 @@
-私の理解
 本件では、画像とその画像に一致する説明が正解データとして与えられます。
 式を見るとDにzノイズとt1t2の間の値が入ることはわかるのですが、
 実際にt1t2がなにを示しているのかわかりません。

修正

2021/02/12 10:05

投稿

watchdogs

スコア54

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- GAN-INTの損失関数について教えて下さい。
1	+ GAN-INTの評価関数について教えて下さい。

body CHANGED Viewed

@@ -1,5 +1,5 @@
 GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
-GAN-INTの損失関数について理解したので教えて欲しいです。
+GAN-INTの評価関数について理解したので教えて欲しいです。
 下記の論文の内容になります。
 [リンク内容](https://arxiv.org/pdf/1605.05396.pdf)
@@ -11,16 +11,8 @@
 私の理解
 本件では、画像とその画像に一致する説明が正解データとして与えられます。
-GAN-INTは、識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章と正解画像のペアに対して行われます。
-正解画像と正解画像に一致する文章で認識Dは学習が進む度に潜在空間に値がプロットされ？正解画像の特徴を捉えます？
+式を見るとDにzノイズとt1t2の間の値が入ることはわかるのですが、
-t1ではそのエポックで学習時にプロットした値であり、
+実際にt1t2がなにを示しているのかわかりません。
-t2はその前の値である
-従ってその間を保管している？
-GANーINTではそれらの潜在空間にプロットされた値の間を保管します。
+GAN-INTについて理解したので教えて頂けますでしょうか。
-間を補間することでデータは滑らかに特徴を捉えることが出来るので、精度の高い画像を生成することが出来ます。
-長文で申し訳ございませんが
-この認識で正しいかわからないので、教えて頂けると助かります。
 よろしくお願い致します。

文章修正

2021/02/12 10:05

投稿

watchdogs

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -8,12 +8,7 @@
 ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
-質問
-・t1~t2の補間をしているという理解ですが、t1,t2とはどのことを指しているのか知りたい。
-・βは補間の係数でしょうか。
-・Dに入っているのはノイズとt1-t2の行間の補間されたエンコードされたテキストデータでしょうか。
 私の理解
 本件では、画像とその画像に一致する説明が正解データとして与えられます。
 GAN-INTは、識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章と正解画像のペアに対して行われます。

質問文を変更しました。

2021/02/12 09:45

投稿

watchdogs

スコア54

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- GAN-INTについて教えて下さい。
1	+ GAN-INTの損失関数について教えて下さい。

body CHANGED Viewed

@@ -1,5 +1,5 @@
-GAN-INTではどのようなことを行っているのかよく理解できません。
+GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
-損失関数の式の内容及びGAN-INTについて理解が正しいか教えて欲しいです。
+GAN-INTの損失関数について理解したので教えて欲しいです。
 下記の論文の内容になります。
 [リンク内容](https://arxiv.org/pdf/1605.05396.pdf)
@@ -7,6 +7,7 @@
 下記にがGAN－INTの損失関数です。
 ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
 質問
 ・t1~t2の補間をしているという理解ですが、t1,t2とはどのことを指しているのか知りたい。
 ・βは補間の係数でしょうか。
@@ -15,10 +16,16 @@
 私の理解
 本件では、画像とその画像に一致する説明が正解データとして与えられます。
-GAN-INTは、
-識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章に対して補間をすることで、Gはトレーニングポイント間のデータ多様体のギャップを埋めることが出来、画像の生成精度を上げることを目的にしているモデルである。
+GAN-INTは、識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章と正解画像のペアに対して行われます。
+正解画像と正解画像に一致する文章で認識Dは学習が進む度に潜在空間に値がプロットされ？正解画像の特徴を捉えます？
+t1ではそのエポックで学習時にプロットした値であり、
+t2はその前の値である
+従ってその間を保管している？
+GANーINTではそれらの潜在空間にプロットされた値の間を保管します。
+間を補間することでデータは滑らかに特徴を捉えることが出来るので、精度の高い画像を生成することが出来ます。
 長文で申し訳ございませんが
-教えて頂けると助かります。
+この認識で正しいかわからないので、教えて頂けると助かります。
 よろしくお願い致します。