VAEを用いて高次元観測を圧縮し強化学習の提案手法への入力を目指しています。
https://www.tensorflow.org/tutorials/generative/cvae
こちらに載っているVAEのサンプルコードはMNISTの手書き文字データを扱っており、二値分類問題として損失を計算してパラメータを更新しています。
私は観測値の復元を目指しており、入出力データの誤差計算を回帰問題に合うものに変更したいのですが、コードを見る限りただ置き換えるだけではダメだと感じ悩んでいます。
引用テキスト「https://www.tensorflow.org/tutorials/generative/cvae」より
Python
1def log_normal_pdf(sample, mean, logvar, raxis=1): 2 log2pi = tf.math.log(2. * np.pi) 3 return tf.reduce_sum( 4 -.5 * ((sample - mean) ** 2. * tf.exp(-logvar) + logvar + log2pi), 5 axis=raxis) 6 7def compute_loss(model, x): 8 mean, logvar = model.encode(x) 9 z = model.reparameterize(mean, logvar) 10 x_logit = model.decode(z) 11 cross_ent = tf.nn.sigmoid_cross_entropy_with_logits(logits=x_logit, labels=x) 12 logpx_z = -tf.reduce_sum(cross_ent, axis=[1, 2, 3]) 13 logpz = log_normal_pdf(z, 0., 0.) 14 logqz_x = log_normal_pdf(z, mean, logvar) 15 return -tf.reduce_mean(logpx_z + logpz - logqz_x)
損失関数の要素である「logpx_z」を「tf.nn.sigmoid_cross_entropy_with_logits」の出力値から計算しています。
これはロジスティック損失を求める関数であり、二値分類に扱われるものです。
この関数を回帰問題に合うものに変更したいのですが、なぜロジスティック損失から「logpx_z」を計算できるか理解できず、回帰問題に合う平均二乗誤差にどう変更して良いのかわかりません。
「logpx_z」を「tf.nn.sigmoid_cross_entropy_with_logits」の出力値からreduce_sum関数の足し合わせでなぜ計算できるのかご存じの方いらっしゃいませいたら、ご回答お願いいたします。
あなたの回答
tips
プレビュー