質問編集履歴
8
タイトル修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
GAN-INTの評価関数について教えて下さい。
|
1
|
+
画像生成 GAN-INTの評価関数について教えて下さい。
|
test
CHANGED
File without changes
|
7
質問を修正しました。
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,6 +1,12 @@
|
|
1
1
|
GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
|
2
2
|
|
3
3
|
GAN-INTの評価関数について理解したので教えて欲しいです。
|
4
|
+
|
5
|
+
|
6
|
+
|
7
|
+
下記にがGAN-INTの損失関数です。
|
8
|
+
|
9
|
+
![イメージ説明](4f6c652135810bc7a23fe79284695c87.png)
|
4
10
|
|
5
11
|
|
6
12
|
|
@@ -8,11 +14,7 @@
|
|
8
14
|
|
9
15
|
[リンク内容](https://arxiv.org/pdf/1605.05396.pdf)
|
10
16
|
|
11
|
-
|
12
|
-
|
13
|
-
|
17
|
+
内容は4.3に記載されています。
|
14
|
-
|
15
|
-
![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
|
16
18
|
|
17
19
|
|
18
20
|
|
@@ -20,10 +22,56 @@
|
|
20
22
|
|
21
23
|
|
22
24
|
|
23
|
-
|
25
|
+
質問
|
24
26
|
|
27
|
+
・テキスト補間(第3項)では何をしているのか知りたい
|
28
|
+
|
25
|
-
|
29
|
+
・第3項が追加されたことで式はどの様に影響してくるのか知りたい
|
26
30
|
|
27
31
|
|
28
32
|
|
33
|
+
|
34
|
+
|
35
|
+
添付しています論文にはテキスト補間の目的関数を足したと記載がありましたので
|
36
|
+
|
37
|
+
ここに貼り付けた画像の様な式になる様に従来のGANの評価関数の式にテキスト補間の式を足した理解でいます。
|
38
|
+
|
39
|
+
ここで理解ができないのが、
|
40
|
+
|
41
|
+
画像生成した結果と正解の文章のエンコードされたものをペアで読み込んでいると記載があります。
|
42
|
+
|
43
|
+
ここから冒頭の
|
44
|
+
|
45
|
+
トレーニングセットの正解の文章のエンコードされたデータの間を補間するだけで、大量の追加のテキスト埋め込みを生成できます。
|
46
|
+
|
47
|
+
のところで、
|
48
|
+
|
49
|
+
よく理解できていないのですが、
|
50
|
+
|
51
|
+
|
52
|
+
|
53
|
+
下記の理解で良いのか知りたいです。
|
54
|
+
|
55
|
+
|
56
|
+
|
57
|
+
ノイズと正解テキストの補間データを比べて
|
58
|
+
|
59
|
+
ノイズと正解テキストに無い間をここの式して補間しその結果が第三項の赤枠に入っているという認識で良いのでしょうか。
|
60
|
+
|
61
|
+
|
62
|
+
|
63
|
+
そうすると、
|
64
|
+
|
65
|
+
本来のGANの式であれば、
|
66
|
+
|
67
|
+
Dは右辺の第1項と第2項を共に大きくする様な働きを持ちます。
|
68
|
+
|
69
|
+
Gは第2項を小さくする様に
|
70
|
+
|
71
|
+
働きますが、
|
72
|
+
|
73
|
+
第3項が追加されたことでこれらはどの様な働きをするのか理解ができません。
|
74
|
+
|
75
|
+
長文で失礼しますが、
|
76
|
+
|
29
77
|
よろしくお願い致します。
|
6
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -18,13 +18,9 @@
|
|
18
18
|
|
19
19
|
|
20
20
|
|
21
|
-
式では生成した結果のzにt1t2を加えています。
|
22
21
|
|
23
|
-
それはDに生成した画像で得られたzノイズとt1t2の間の値が入ることはわかるのですが、
|
24
22
|
|
25
23
|
実際にt1t2がなにを示しているのかわかりません。
|
26
|
-
|
27
|
-
GAN-INTはが何をしているのか論文を読んでもわかりません。
|
28
24
|
|
29
25
|
GAN-INTについて理解したので教えて頂けますでしょうか。
|
30
26
|
|
5
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -18,15 +18,13 @@
|
|
18
18
|
|
19
19
|
|
20
20
|
|
21
|
+
式では生成した結果のzにt1t2を加えています。
|
21
22
|
|
22
|
-
|
23
|
-
|
24
|
-
|
25
|
-
本件では、画像とその画像に一致する説明が正解データとして与えられます。
|
26
|
-
|
27
|
-
|
23
|
+
それはDに生成した画像で得られたzノイズとt1t2の間の値が入ることはわかるのですが、
|
28
24
|
|
29
25
|
実際にt1t2がなにを示しているのかわかりません。
|
26
|
+
|
27
|
+
GAN-INTはが何をしているのか論文を読んでもわかりません。
|
30
28
|
|
31
29
|
GAN-INTについて理解したので教えて頂けますでしょうか。
|
32
30
|
|
4
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -20,7 +20,7 @@
|
|
20
20
|
|
21
21
|
|
22
22
|
|
23
|
-
|
23
|
+
|
24
24
|
|
25
25
|
本件では、画像とその画像に一致する説明が正解データとして与えられます。
|
26
26
|
|
3
修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
GAN-INTの
|
1
|
+
GAN-INTの評価関数について教えて下さい。
|
test
CHANGED
@@ -1,6 +1,6 @@
|
|
1
1
|
GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
|
2
2
|
|
3
|
-
GAN-INTの
|
3
|
+
GAN-INTの評価関数について理解したので教えて欲しいです。
|
4
4
|
|
5
5
|
|
6
6
|
|
@@ -24,27 +24,11 @@
|
|
24
24
|
|
25
25
|
本件では、画像とその画像に一致する説明が正解データとして与えられます。
|
26
26
|
|
27
|
-
|
27
|
+
式を見るとDにzノイズとt1t2の間の値が入ることはわかるのですが、
|
28
28
|
|
29
|
-
|
29
|
+
実際にt1t2がなにを示しているのかわかりません。
|
30
30
|
|
31
|
-
t1ではそのエポックで学習時にプロットした値であり、
|
32
|
-
|
33
|
-
t2はその前の値である
|
34
|
-
|
35
|
-
従ってその間を保管している?
|
36
|
-
|
37
|
-
GANーINTではそれらの潜在空間にプロットされた値の間を保管します。
|
38
|
-
|
39
|
-
間を補間することでデータは滑らかに特徴を捉えることが出来るので、精度の高い画像を生成することが出来ます。
|
40
|
-
|
41
|
-
|
42
|
-
|
43
|
-
長文で申し訳ございませんが
|
44
|
-
|
45
|
-
|
31
|
+
GAN-INTについて理解したので教えて頂けますでしょうか。
|
46
|
-
|
47
|
-
|
48
32
|
|
49
33
|
|
50
34
|
|
2
文章修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -15,16 +15,6 @@
|
|
15
15
|
![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
|
16
16
|
|
17
17
|
|
18
|
-
|
19
|
-
|
20
|
-
|
21
|
-
質問
|
22
|
-
|
23
|
-
・t1~t2の補間をしているという理解ですが、t1,t2とはどのことを指しているのか知りたい。
|
24
|
-
|
25
|
-
・βは補間の係数でしょうか。
|
26
|
-
|
27
|
-
・Dに入っているのはノイズとt1-t2の行間の補間されたエンコードされたテキストデータでしょうか。
|
28
18
|
|
29
19
|
|
30
20
|
|
1
質問文を変更しました。
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
GAN-INTについて教えて下さい。
|
1
|
+
GAN-INTの損失関数について教えて下さい。
|
test
CHANGED
@@ -1,6 +1,6 @@
|
|
1
|
-
GAN-INTで
|
1
|
+
GAN-INTで提案されている下記式についてどのようなことを行っているのか下記がわかっていません。
|
2
2
|
|
3
|
-
|
3
|
+
GAN-INTの損失関数について理解したので教えて欲しいです。
|
4
4
|
|
5
5
|
|
6
6
|
|
@@ -13,6 +13,8 @@
|
|
13
13
|
下記にがGAN-INTの損失関数です。
|
14
14
|
|
15
15
|
![![イメージ説明](83a19d85a74f471d7be15009e4b36194.png)](04e80644049cc718fcf8e388e3c98925.png)
|
16
|
+
|
17
|
+
|
16
18
|
|
17
19
|
|
18
20
|
|
@@ -32,15 +34,27 @@
|
|
32
34
|
|
33
35
|
本件では、画像とその画像に一致する説明が正解データとして与えられます。
|
34
36
|
|
35
|
-
GAN-INTは、
|
37
|
+
GAN-INTは、識別器Dで任意の入力された文章ではなく、あらかじめ用意した正解文章と正解画像のペアに対して行われます。
|
36
38
|
|
39
|
+
正解画像と正解画像に一致する文章で認識Dは学習が進む度に潜在空間に値がプロットされ?正解画像の特徴を捉えます?
|
40
|
+
|
41
|
+
t1ではそのエポックで学習時にプロットした値であり、
|
42
|
+
|
43
|
+
t2はその前の値である
|
44
|
+
|
45
|
+
従ってその間を保管している?
|
46
|
+
|
47
|
+
GANーINTではそれらの潜在空間にプロットされた値の間を保管します。
|
48
|
+
|
37
|
-
|
49
|
+
間を補間することでデータは滑らかに特徴を捉えることが出来るので、精度の高い画像を生成することが出来ます。
|
38
50
|
|
39
51
|
|
40
52
|
|
41
53
|
長文で申し訳ございませんが
|
42
54
|
|
43
|
-
教えて頂けると助かります。
|
55
|
+
この認識で正しいかわからないので、教えて頂けると助かります。
|
56
|
+
|
57
|
+
|
44
58
|
|
45
59
|
|
46
60
|
|