質問編集履歴

8

タイトル修正

2021/02/13 04:15

投稿

watchdogs
watchdogs

スコア54

test CHANGED
@@ -1 +1 @@
1
- GAN-INTの評価関数について教えて下さい。
1
+ 画像生成 GAN-INTの評価関数について教えて下さい。
test CHANGED
File without changes

7

質問を修正しました。

2021/02/13 04:15

投稿

watchdogs
watchdogs

スコア54

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,12 @@
1
1
  GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
2
2
 
3
3
  GAN-INTの評価関数について理解したので教えて欲しいです。
4
+
5
+
6
+
7
+ 下記にがGAN-INTの損失関数です。
8
+
9
+ ![イメージ説明](4f6c652135810bc7a23fe79284695c87.png)
4
10
 
5
11
 
6
12
 
@@ -8,11 +14,7 @@
8
14
 
9
15
  [リンク内容](https://arxiv.org/pdf/1605.05396.pdf)
10
16
 
11
-
12
-
13
- にがGAN-INTの損失関数です。
17
+ 内容は4.3に載されています。
14
-
15
- ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
16
18
 
17
19
 
18
20
 
@@ -20,10 +22,56 @@
20
22
 
21
23
 
22
24
 
23
- 実際にt1t2がなにを示しているのかわかりません。
25
+ 質問
24
26
 
27
+ ・テキスト補間(第3項)では何をしているのか知りたい
28
+
25
- GAN-INTつい理解したで教えて頂けますでしょう
29
+ ・第3項が追加されたことで式はどの様影響しくるのか知りたい
26
30
 
27
31
 
28
32
 
33
+
34
+
35
+ 添付しています論文にはテキスト補間の目的関数を足したと記載がありましたので
36
+
37
+ ここに貼り付けた画像の様な式になる様に従来のGANの評価関数の式にテキスト補間の式を足した理解でいます。
38
+
39
+ ここで理解ができないのが、
40
+
41
+ 画像生成した結果と正解の文章のエンコードされたものをペアで読み込んでいると記載があります。
42
+
43
+ ここから冒頭の
44
+
45
+ トレーニングセットの正解の文章のエンコードされたデータの間を補間するだけで、大量の追加のテキスト埋め込みを生成できます。
46
+
47
+ のところで、
48
+
49
+ よく理解できていないのですが、
50
+
51
+
52
+
53
+ 下記の理解で良いのか知りたいです。
54
+
55
+
56
+
57
+ ノイズと正解テキストの補間データを比べて
58
+
59
+ ノイズと正解テキストに無い間をここの式して補間しその結果が第三項の赤枠に入っているという認識で良いのでしょうか。
60
+
61
+
62
+
63
+ そうすると、
64
+
65
+ 本来のGANの式であれば、
66
+
67
+ Dは右辺の第1項と第2項を共に大きくする様な働きを持ちます。
68
+
69
+ Gは第2項を小さくする様に
70
+
71
+ 働きますが、
72
+
73
+ 第3項が追加されたことでこれらはどの様な働きをするのか理解ができません。
74
+
75
+ 長文で失礼しますが、
76
+
29
77
  よろしくお願い致します。

6

修正

2021/02/13 04:14

投稿

watchdogs
watchdogs

スコア54

test CHANGED
File without changes
test CHANGED
@@ -18,13 +18,9 @@
18
18
 
19
19
 
20
20
 
21
- 式では生成した結果のzにt1t2を加えています。
22
21
 
23
- それはDに生成した画像で得られたzノイズとt1t2の間の値が入ることはわかるのですが、
24
22
 
25
23
  実際にt1t2がなにを示しているのかわかりません。
26
-
27
- GAN-INTはが何をしているのか論文を読んでもわかりません。
28
24
 
29
25
  GAN-INTについて理解したので教えて頂けますでしょうか。
30
26
 

5

修正

2021/02/12 11:41

投稿

watchdogs
watchdogs

スコア54

test CHANGED
File without changes
test CHANGED
@@ -18,15 +18,13 @@
18
18
 
19
19
 
20
20
 
21
+ 式では生成した結果のzにt1t2を加えています。
21
22
 
22
-
23
-
24
-
25
- 本件では、画像とその画像に一致する説明が正解データとして与えられます。
26
-
27
- 式を見るとDにzノイズとt1t2の間の値が入ることはわかるのですが、
23
+ それはDに生成した画像で得られたzノイズとt1t2の間の値が入ることはわかるのですが、
28
24
 
29
25
  実際にt1t2がなにを示しているのかわかりません。
26
+
27
+ GAN-INTはが何をしているのか論文を読んでもわかりません。
30
28
 
31
29
  GAN-INTについて理解したので教えて頂けますでしょうか。
32
30
 

4

修正

2021/02/12 10:08

投稿

watchdogs
watchdogs

スコア54

test CHANGED
File without changes
test CHANGED
@@ -20,7 +20,7 @@
20
20
 
21
21
 
22
22
 
23
- 私の理解
23
+
24
24
 
25
25
  本件では、画像とその画像に一致する説明が正解データとして与えられます。
26
26
 

3

修正

2021/02/12 10:05

投稿

watchdogs
watchdogs

スコア54

test CHANGED
@@ -1 +1 @@
1
- GAN-INTの損失関数について教えて下さい。
1
+ GAN-INTの評価関数について教えて下さい。
test CHANGED
@@ -1,6 +1,6 @@
1
1
  GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
2
2
 
3
- GAN-INTの損失関数について理解したので教えて欲しいです。
3
+ GAN-INTの評価関数について理解したので教えて欲しいです。
4
4
 
5
5
 
6
6
 
@@ -24,27 +24,11 @@
24
24
 
25
25
  本件では、画像とその画像に一致する説明が正解データとして与えられます。
26
26
 
27
- GAN-INTは、識別器Dで任意の入力された文章でなく、あらじめ用意した正解文章と正解画像ペアに対して行われま
27
+ 式を見るとDにzノイズとt1t2間の値がることが、
28
28
 
29
- 正解画像と正解画像一致する文章で認識Dは学習進む度潜在空間に値がプロットされ?正解画像特徴を捉えす?
29
+ 実際t1t2を示しているかわかりせん。
30
30
 
31
- t1ではそのエポックで学習時にプロットした値であり、
32
-
33
- t2はその前の値である
34
-
35
- 従ってその間を保管している?
36
-
37
- GANーINTではそれらの潜在空間にプロットされた値の間を保管します。
38
-
39
- 間を補間することでデータは滑らかに特徴を捉えることが出来るので、精度の高い画像を生成することが出来ます。
40
-
41
-
42
-
43
- 長文で申し訳ございませんが
44
-
45
- この認識で正いかわからないので教えて頂けると助かります。
31
+ GAN-INTについて理解ので教えて頂けますでしょうか
46
-
47
-
48
32
 
49
33
 
50
34
 

2

文章修正

2021/02/12 10:05

投稿

watchdogs
watchdogs

スコア54

test CHANGED
File without changes
test CHANGED
@@ -15,16 +15,6 @@
15
15
  ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
16
16
 
17
17
 
18
-
19
-
20
-
21
- 質問
22
-
23
- ・t1~t2の補間をしているという理解ですが、t1,t2とはどのことを指しているのか知りたい。
24
-
25
- ・βは補間の係数でしょうか。
26
-
27
- ・Dに入っているのはノイズとt1-t2の行間の補間されたエンコードされたテキストデータでしょうか。
28
18
 
29
19
 
30
20
 

1

質問文を変更しました。

2021/02/12 09:45

投稿

watchdogs
watchdogs

スコア54

test CHANGED
@@ -1 +1 @@
1
- GAN-INTについて教えて下さい。
1
+ GAN-INTの損失関数について教えて下さい。
test CHANGED
@@ -1,6 +1,6 @@
1
- GAN-INTでどのようなことを行っているのかよく理解できません。
1
+ GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
2
2
 
3
- 損失関数の式の内容及びGAN-INTについて理解が正いか教えて欲しいです。
3
+ GAN-INTの損失関数について理解したので教えて欲しいです。
4
4
 
5
5
 
6
6
 
@@ -13,6 +13,8 @@
13
13
  下記にがGAN-INTの損失関数です。
14
14
 
15
15
  ![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
16
+
17
+
16
18
 
17
19
 
18
20
 
@@ -32,15 +34,27 @@
32
34
 
33
35
  本件では、画像とその画像に一致する説明が正解データとして与えられます。
34
36
 
35
- GAN-INTは、
37
+ GAN-INTは、識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章と正解画像のペアに対して行われます。
36
38
 
39
+ 正解画像と正解画像に一致する文章で認識Dは学習が進む度に潜在空間に値がプロットされ?正解画像の特徴を捉えます?
40
+
41
+ t1ではそのエポックで学習時にプロットした値であり、
42
+
43
+ t2はその前の値である
44
+
45
+ 従ってその間を保管している?
46
+
47
+ GANーINTではそれらの潜在空間にプロットされた値の間を保管します。
48
+
37
- 識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章に対して補間することで、Gはトレーニングポイント間のデータ多様体のギャップ埋めることが出来、画像生成精度を上げることを目的にしているモデルである
49
+ 間を補間することでデータは滑らかに特徴捉えることが出来るので精度の高い画像生成ることが出来ます
38
50
 
39
51
 
40
52
 
41
53
  長文で申し訳ございませんが
42
54
 
43
- 教えて頂けると助かります。
55
+ この認識で正しいかわからないので、教えて頂けると助かります。
56
+
57
+
44
58
 
45
59
 
46
60