teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

8

タイトル修正

2021/02/13 04:15

投稿

watchdogs
watchdogs

スコア54

title CHANGED
@@ -1,1 +1,1 @@
1
- GAN-INTの評価関数について教えて下さい。
1
+ 画像生成 GAN-INTの評価関数について教えて下さい。
body CHANGED
File without changes

7

質問を修正しました。

2021/02/13 04:15

投稿

watchdogs
watchdogs

スコア54

title CHANGED
File without changes
body CHANGED
@@ -1,15 +1,39 @@
1
1
  GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
2
2
  GAN-INTの評価関数について理解したので教えて欲しいです。
3
3
 
4
+ 下記にがGAN-INTの損失関数です。
5
+ ![イメージ説明](4f6c652135810bc7a23fe79284695c87.png)
6
+
4
7
  下記の論文の内容になります。
5
8
  [リンク内容](https://arxiv.org/pdf/1605.05396.pdf)
9
+ 内容は4.3に記載されています。
6
10
 
7
- 下記にがGAN-INTの損失関数です。
8
- ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
9
11
 
10
12
 
13
+ 質問
14
+ ・テキスト補間(第3項)では何をしているのか知りたい
15
+ ・第3項が追加されたことで式はどの様に影響してくるのか知りたい
11
16
 
12
- 実際にt1t2がなにを示しているのかわかりません。
13
- GAN-INTについて理解したので教えて頂けますでしょうか。
14
17
 
18
+ 添付しています論文にはテキスト補間の目的関数を足したと記載がありましたので
19
+ ここに貼り付けた画像の様な式になる様に従来のGANの評価関数の式にテキスト補間の式を足した理解でいます。
20
+ ここで理解ができないのが、
21
+ 画像生成した結果と正解の文章のエンコードされたものをペアで読み込んでいると記載があります。
22
+ ここから冒頭の
23
+ トレーニングセットの正解の文章のエンコードされたデータの間を補間するだけで、大量の追加のテキスト埋め込みを生成できます。
24
+ のところで、
25
+ よく理解できていないのですが、
26
+
27
+ 下記の理解で良いのか知りたいです。
28
+
29
+ ノイズと正解テキストの補間データを比べて
30
+ ノイズと正解テキストに無い間をここの式して補間しその結果が第三項の赤枠に入っているという認識で良いのでしょうか。
31
+
32
+ そうすると、
33
+ 本来のGANの式であれば、
34
+ Dは右辺の第1項と第2項を共に大きくする様な働きを持ちます。
35
+ Gは第2項を小さくする様に
36
+ 働きますが、
37
+ 第3項が追加されたことでこれらはどの様な働きをするのか理解ができません。
38
+ 長文で失礼しますが、
15
39
  よろしくお願い致します。

6

修正

2021/02/13 04:14

投稿

watchdogs
watchdogs

スコア54

title CHANGED
File without changes
body CHANGED
@@ -8,10 +8,8 @@
8
8
  ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
9
9
 
10
10
 
11
- 式では生成した結果のzにt1t2を加えています。
11
+
12
- それはDに生成した画像で得られたzノイズとt1t2の間の値が入ることはわかるのですが、
13
12
  実際にt1t2がなにを示しているのかわかりません。
14
- GAN-INTはが何をしているのか論文を読んでもわかりません。
15
13
  GAN-INTについて理解したので教えて頂けますでしょうか。
16
14
 
17
15
  よろしくお願い致します。

5

修正

2021/02/12 11:41

投稿

watchdogs
watchdogs

スコア54

title CHANGED
File without changes
body CHANGED
@@ -8,11 +8,10 @@
8
8
  ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
9
9
 
10
10
 
11
-
12
-
13
- 本件では、画像とそ画像一致する説明が正解データとして与られます。
11
+ では生成した結果t1t2を加ています。
14
- 式を見るとDにzノイズとt1t2の間の値が入ることはわかるのですが、
12
+ それはDに生成した画像で得られたzノイズとt1t2の間の値が入ることはわかるのですが、
15
13
  実際にt1t2がなにを示しているのかわかりません。
14
+ GAN-INTはが何をしているのか論文を読んでもわかりません。
16
15
  GAN-INTについて理解したので教えて頂けますでしょうか。
17
16
 
18
17
  よろしくお願い致します。

4

修正

2021/02/12 10:08

投稿

watchdogs
watchdogs

スコア54

title CHANGED
File without changes
body CHANGED
@@ -9,7 +9,7 @@
9
9
 
10
10
 
11
11
 
12
- 私の理解
12
+
13
13
  本件では、画像とその画像に一致する説明が正解データとして与えられます。
14
14
  式を見るとDにzノイズとt1t2の間の値が入ることはわかるのですが、
15
15
  実際にt1t2がなにを示しているのかわかりません。

3

修正

2021/02/12 10:05

投稿

watchdogs
watchdogs

スコア54

title CHANGED
@@ -1,1 +1,1 @@
1
- GAN-INTの損失関数について教えて下さい。
1
+ GAN-INTの評価関数について教えて下さい。
body CHANGED
@@ -1,5 +1,5 @@
1
1
  GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
2
- GAN-INTの損失関数について理解したので教えて欲しいです。
2
+ GAN-INTの評価関数について理解したので教えて欲しいです。
3
3
 
4
4
  下記の論文の内容になります。
5
5
  [リンク内容](https://arxiv.org/pdf/1605.05396.pdf)
@@ -11,16 +11,8 @@
11
11
 
12
12
  私の理解
13
13
  本件では、画像とその画像に一致する説明が正解データとして与えられます。
14
- GAN-INTは、識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章と正解画像のペアに対して行われます。
15
- 正解画像と正解画像に一致す文章で認識Dは学習が進む度潜在空値がプロットされ?正解画像特徴を捉えま
14
+ 式を見Dにzノイズとt1t2の値が入ることはわかるが、
16
- t1ではそのエポックで学習時プロットた値であ
15
+ 実際t1t2がなにを示ているのかわかません。
17
- t2はその前の値である
18
- 従ってその間を保管している?
19
- GANINTではそれらの潜在空間プロットされ間を保管します。
16
+ GAN-INTについて理解したので教えて頂けますでしょうか
20
- 間を補間することでデータは滑らかに特徴を捉えることが出来るので、精度の高い画像を生成することが出来ます。
21
17
 
22
- 長文で申し訳ございませんが
23
- この認識で正しいかわからないので、教えて頂けると助かります。
24
-
25
-
26
18
  よろしくお願い致します。

2

文章修正

2021/02/12 10:05

投稿

watchdogs
watchdogs

スコア54

title CHANGED
File without changes
body CHANGED
@@ -8,12 +8,7 @@
8
8
  ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
9
9
 
10
10
 
11
- 質問
12
- ・t1~t2の補間をしているという理解ですが、t1,t2とはどのことを指しているのか知りたい。
13
- ・βは補間の係数でしょうか。
14
- ・Dに入っているのはノイズとt1-t2の行間の補間されたエンコードされたテキストデータでしょうか。
15
11
 
16
-
17
12
  私の理解
18
13
  本件では、画像とその画像に一致する説明が正解データとして与えられます。
19
14
  GAN-INTは、識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章と正解画像のペアに対して行われます。

1

質問文を変更しました。

2021/02/12 09:45

投稿

watchdogs
watchdogs

スコア54

title CHANGED
@@ -1,1 +1,1 @@
1
- GAN-INTについて教えて下さい。
1
+ GAN-INTの損失関数について教えて下さい。
body CHANGED
@@ -1,5 +1,5 @@
1
- GAN-INTでどのようなことを行っているのかよく理解できません。
1
+ GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
2
- 損失関数の式の内容及びGAN-INTについて理解が正いか教えて欲しいです。
2
+ GAN-INTの損失関数について理解したので教えて欲しいです。
3
3
 
4
4
  下記の論文の内容になります。
5
5
  [リンク内容](https://arxiv.org/pdf/1605.05396.pdf)
@@ -7,6 +7,7 @@
7
7
  下記にがGAN-INTの損失関数です。
8
8
  ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
9
9
 
10
+
10
11
  質問
11
12
  ・t1~t2の補間をしているという理解ですが、t1,t2とはどのことを指しているのか知りたい。
12
13
  ・βは補間の係数でしょうか。
@@ -15,10 +16,16 @@
15
16
 
16
17
  私の理解
17
18
  本件では、画像とその画像に一致する説明が正解データとして与えられます。
18
- GAN-INTは、
19
- 識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章に対して補間をするこで、Gはトレーニングポイント間のデータ多様体のギャップを埋めることが出来、画像の生成精度を上げることを目的にしているモデルである
19
+ GAN-INTは、識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章と正解画像のペアして行われます
20
+ 正解画像と正解画像に一致する文章で認識Dは学習が進む度に潜在空間に値がプロットされ?正解画像の特徴を捉えます?
21
+ t1ではそのエポックで学習時にプロットした値であり、
22
+ t2はその前の値である
23
+ 従ってその間を保管している?
24
+ GANーINTではそれらの潜在空間にプロットされた値の間を保管します。
25
+ 間を補間することでデータは滑らかに特徴を捉えることが出来るので、精度の高い画像を生成することが出来ます。
20
26
 
21
27
  長文で申し訳ございませんが
22
- 教えて頂けると助かります。
28
+ この認識で正しいかわからないので、教えて頂けると助かります。
23
29
 
30
+
24
31
  よろしくお願い致します。