回帰分析の予測値の粒度を上げたい

たかしくんは八百屋へお使いに行きました。
リンゴ１個とミカン３個を買うと１９０円，リンゴ３個とミカン１個を買うと３３０円するようです。
リンゴ２個とミカン４個を買うといくらになるでしょうか？
TensorFlowコトハジメ八百屋で勾配降下法

手動計算では、答えが９０円と３０円になるのですが、TensorFlowで組んだ場合に答えが９９円と２５円というように１円単位になります。
これを、TensorFlowで組んだ場合でも１０円単位で答えが出るようにしたい場合、どのようにすればいいのでしょうか。

GradientDescentOptimizer(0.02) の値を(10.02) とすると逆に答えが出なくなってしまう。

予測値の粒度を上げるという表現がどうかと思ったのですが、言葉が思いつかなかった。

# coding: utf-8
# 必要なモジュールを読み込む
import numpy as np
import tensorflow as tf

# 1. 予測式(モデル)を記述する
# 入力変数と出力変数のプレースホルダを生成
x = tf.placeholder(tf.float32, shape=(None, 2), name="x")
y_ = tf.placeholder(tf.float32, shape=(None, 1), name="y")
# モデルパラメータ
a = tf.Variable(tf.zeros((2, 1)), name="a")
# モデル式
y = tf.matmul(x, a)

# 2. 学習に必要な関数を定義する
# 誤差関数(loss)
loss = tf.reduce_mean(tf.square(y_ - y))
# 最適化手段を選ぶ(最急降下法)
train_step = tf.train.GradientDescentOptimizer(0.02).minimize(loss)


# 3. 実際に学習処理を実行する
# (1) 訓練データを生成する
train_x = np.array([[1., 3.], [3., 1.], [5., 7.]])
train_y = np.array([190., 330., 660.]).reshape(3, 1)
print("x=", train_x)
print("y=", train_y)

# (2) セッションを準備し，変数を初期化
sess = tf.Session()
init = tf.initialize_all_variables()
sess.run(init)

# (3) 最急勾配法でパラメータ更新 (100回更新する)
for i in range(100):
    _, l, a_ = sess.run([train_step, loss, a], feed_dict={x: train_x, y_: train_y})
    if (i + 1) % 10 == 0:
        print("step=%3d, a1=%6.2f, a2=%6.2f, loss=%.2f" % (i + 1, a_[0], a_[1], l))


# (4) 学習結果を出力
est_a = sess.run(a, feed_dict={x: train_x, y_: train_y})
print("Estimated: a1=%6.2f, a2=%6.2f" % (est_a[0], est_a[1]))

# 4. 新しいデータに対して予測する
# (1) 新しいデータを用意
new_x = np.array([2., 4.]).reshape(1, 2)

# (2) 学習結果をつかって，予測実施
new_y = sess.run(y, feed_dict={x: new_x})
print(new_y)

# 5. 後片付け
# セッションを閉じる
sess.close()

行動規範の内容に同意します

回答2件

今回のケースであれば、モデルとコスト関数を変えるといいかと思います。

まず、この問題の本質はリンゴ+ミカン×3=190とリンゴ×3+ミカン=330を満たすリンゴとミカンの値を求めることで、連立方程式を解くことを意味します。この場合、連立方程式を解くことはふたつの式の交点を求めることと同意なので、

リンゴ+ミカン×3-190=リンゴ×3+ミカン-330

と式変形します。表記を簡単するため、左辺をfunc1右辺をfunc2として更に式変形すると

func1-func2=0

となります。今回の問題はこのfunc1-func2をリンゴとミカンの値をオプティマイザーを使って更新して、限りなくゼロに近づけることということになります。
よって、モデル式はfunc1-func2になります。コスト関数はfunc1-func2がゼロに近づけることが目的なので、絶対値誤差でいいかと思います。もしかすると、今の二乗誤差でもうまくいくかもしれません。
この場合、説明変数は（1,3,3,1）、目的変数は0でいいかと思います。（モデル式の形に依存）つまり、訓練データを生成する必要はないということです。

アプローチ方法が連立方程式を解くというところから出発しているので、イメージとかなり違うと思いますが、リンゴとミカンの値は解析的に解いたものに近くなるはずです。

なお、単純に連立方程式の解を求めるのであれば、行列式を使う方法やscipyにある連立方程式の近似解を求める関数を使う方法もあります

投稿2018/03/27 20:49

R.Shigemori

総合スコア3376

yaju

2018/03/28 00:29

この問題はあくまで例題なので、訓練なく連立方程式を解くでも求められるんでしょうけど。別の問題の時でも、似たようなことが出来る方法が分かればいいなと思ったのです。絶対値誤差で試してみます。

行動規範の内容に同意します

結果について四捨五入すれば良さそうですが。

カテゴリの場合も、小数で割合が出て、それの最大のインデックスを取っているので、同じことをやればいいと思います

python
1import numpy as np
2
3np.random.seed(0)
4
5a = np.random.randint(0, 300, size=(10))
6print(a)
7# [172  47 117 192 251 195   9 211 277 242]
8
9b = np.round(a, decimals=-1)
10print(b)
11# [170  50 120 190 250 200  10 210 280 240]

python
1new_y = sess.run(....)
2
3new_y = np.round(new_y, decimals=-1)

投稿2018/03/27 14:22

編集2018/03/27 23:44

mkgrei

総合スコア8560

yaju

2018/03/27 14:30

すみません。回答内容が理解できないです。具体的にはどうすればいいのでしょう。

mkgrei

2018/03/27 14:40

結果のnew_yに以下のような関数を適用すると有効桁が落ちます。 https://docs.scipy.org/doc/numpy/reference/generated/numpy.round_.html

yaju

2018/03/27 14:55

Tensorflowの場合、new_y = sess.run(y, feed_dict={x: new_x}), decimals=-1) としても答えが四捨五入されないんですよね。単純な四捨五入ではないわけですよ。

mkgrei

2018/03/27 23:47

sessというのはtensorflowのセッションを管理するクラスのインスタンスなので、四捨五入しません。 numpy.roundを使えば四捨五入できますが、お望みの挙動ではないということでしょうか。

yaju

2018/03/28 00:16

sessのインスタンスに挟んでroundしたコメントはミスです、ごめんなさい。 new_y = np.round(new_y, decimals=-1) としても、Google Colaboratory で試してももらえば分かりますが、望みの挙動にはなりません。

mkgrei

2018/03/28 00:20

期待される挙動は10の位で出力されることですか？それとも、解析解（手計算）と同じ答えを得ることですか？

yaju

2018/03/28 00:30

目的は解析解（手計算）と同じ答えを得ることになります。

mkgrei

2018/03/28 06:20

そうすると整数問題になるので勾配が計算できなくなります。整数問題は勾配法ではなくシンプレクス法で解くのが一般的ではないでしょうか？

yaju

2018/03/28 08:44

mkgreiさん、いろいろコメントありがとうございます。勾配では計算ができないという結論であればそれでいいです。勾配では計算は無理かどうかの判断すら自分には分からなかったのですから。もともと素朴な疑問で10円単位でも予測値が分かればいいなーと思ってたのです。出来るならそのやり方を知りたかったのです。

mkgrei

2018/03/28 08:58

10円単位でやるためには、金額に係る数をすべて10で割ってから、変数をすべて整数にすることで実現できます。問題はその後で、整数型だと勾配計算のところでエラーが出てしまいます。微小な量なので、妥当なふるまいであると考えます。すべてを実数型にして、一部整数値へのキャストなども考えましたが、やはり勾配が消失してしまうようで、更新することができません。後は、整数でもうまく更新量を計算するアルゴリズムを独自で実装することになるかと思います。

行動規範の内容に同意します

あなたの回答