teratail【テラテイル】｜ITエンジニア特化型Q&Aサイト

解決策

2019/06/07 00:59

投稿

スコア89

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -103,4 +103,16 @@
 ### 追記3
-optimizerの問題ではないかとの指摘を受けて、Adam,AdaDelta,SGDで試しましたが結果は変わらず…
+optimizerの問題ではないかとの指摘を受けて、Adam,AdaDelta,SGDで試しましたが結果は変わらず…
+### 解決策？
+passerbyさんに言われた通り、
+```python3
+rec_loss += F.mean_squared_error(x, self.decode(z)) / k
+```
+を
+```python3
+rec_loss += F.mean(F.sum((x - self.decode(z)) ** 2, axis=1))
+```
+に変えるとうまくいきます。でもなぜだ…？

2019/06/07 00:59

投稿

スコア89

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -89,8 +89,18 @@
 これはなぜでしょうか。
-### 追記
+### 追記1
 bernoulli_nllはデフォルトではすべて合計する一方で、mean_squared_errorは二乗誤差をバッチとピクセルの両方で平均するので、再構成項が過小評価されてしまっているかもしれないと考えました。
-MNSITは28×28の画像なので、MSEを用いる際には28×28×F.mean_squared_error(x, decode(z))とすれば良いと思い、試してみましたが結果は変わりませんでした。
+MNSITは28×28の画像なので、MSEを用いる際には28×28×F.mean_squared_error(x, decode(z))とすれば良いと思い、試してみましたが結果は変わりませんでした。
+### 追記2
+chainerでMSEを使ったVAEの実装を行っているコードを見つけました。
+（https://github.com/maguro27/VAE-CIFAR10_chainer/blob/master/VAE_CIFAR10.ipynb）
+なぜ、このコードでは動いて、私の上のコードでは学習がうまくいかないのでしょうか。
+### 追記3
+optimizerの問題ではないかとの指摘を受けて、Adam,AdaDelta,SGDで試しましたが結果は変わらず…

やったことを書き加えた。

2019/06/04 01:32

投稿

スコア89

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -87,4 +87,10 @@
 2. 再構成が行われない。適当なinputを与えても、意味のないoutput画像が得られる。（ちなみにinput画像の種類によらずoutput画像は一定のようです）
 などの結果が得られて、学習がうまくいっていっていないようです。
-これはなぜでしょうか。
+これはなぜでしょうか。
+### 追記
+bernoulli_nllはデフォルトではすべて合計する一方で、mean_squared_errorは二乗誤差をバッチとピクセルの両方で平均するので、再構成項が過小評価されてしまっているかもしれないと考えました。
+MNSITは28×28の画像なので、MSEを用いる際には28×28×F.mean_squared_error(x, decode(z))とすれば良いと思い、試してみましたが結果は変わりませんでした。

2019/06/03 08:56

投稿

スコア89

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -79,7 +79,7 @@
 ところで、疑問なのですが、rec_lossは再構成誤差なので、素朴には平均二乗誤差をつかうのが自然だと思われます。そこでrec_lossの部分を
 ```python3
-rec_loss += F.mean_squared_error(x, self.decode(z)) \ k
+rec_loss += F.mean_squared_error(x, self.decode(z)) / k
 ```
 と書き換え、ほかの条件は全部そのままで（他の部分は一切書き換えずに）、実験すると

誤字訂正

2019/06/03 07:16

投稿

スコア89

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -76,13 +76,13 @@
 ### 疑問
-ところで、疑問なのですが、rec_lossは再構成誤差なので、素朴には平均二乗誤差をつかうのが素朴だと思われます。そこでrec_lossの部分を
+ところで、疑問なのですが、rec_lossは再構成誤差なので、素朴には平均二乗誤差をつかうのが自然だと思われます。そこでrec_lossの部分を
 ```python3
 rec_loss += F.mean_squared_error(x, self.decode(z)) \ k
 ```
-と書き換えて（ほかの条件は全部そのままで）実験すると
+と書き換え、ほかの条件は全部そのままで（他の部分は一切書き換えずに）、実験すると
 1. rec_lossが2epoch目以降、全く減少しない。
 2. 再構成が行われない。適当なinputを与えても、意味のないoutput画像が得られる。（ちなみにinput画像の種類によらずoutput画像は一定のようです）
 などの結果が得られて、学習がうまくいっていっていないようです。

質問編集履歴