質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.86%

pythonのfor文で意図しない値が入ってしまう

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 1
  • VIEW 76

_hh

score 47

pythonを用いてポアソン回帰をしております。問題はポアソン回帰ではなく、その結果を用いてグラフを描く時点で、単純にfor文を用いて配列に値を入れる際に、意図しない動作になってしまっており困っております。

import numpy as np
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import scipy as sp

d = pd.read_csv('Beer.csv',encoding='SHIFT-JIS')
d.head()

X = d[['temperature']]
y = d[['beer_number']]
model = sm.GLM(y, sm.add_constant(X), family=sm.families.Poisson())
res=model.fit()

# 予測値の作成
x_axis = np.arange(0, 45)
y_seq = x_axis

for i in range(len(x_axis)):
    print("i")
    print(i)
    XX=sp.array([1,x_axis[i]])
    print(XX)
    zz=XX.dot(res.params)
    print(zz)

    kk=np.exp(zz)
    print("kk")
    print(kk)

    y_seq[i] = kk
    print("yy")
    print(y_seq[i])


【結果】
i
0
[1 0]
0.4476074167974242
kk
1.5645643533866962
yy
1
i
1
[1 1]
0.5236838580746012
kk
1.6882354281048548
yy
1
i
2
[1 2]
0.5997602993517781
kk
1.82168208967493
yy
1
【質問したいこと】
上記で変数y_seqという配列に、ポアソン回帰の結果のyの予測値を入れたいのですが、なぜか
意図しない整数値ばかりが入ってしまいます。不思議なことに、zzという値をネイピア数のべきにした値、kkというところまではprintすると想定通りの値が入っているのですが、それを単純にそのままy_seq[i]に入れた後に出力すると、そちらの結果は切り下げ?た様な整数値が入ってしまいます。何等かのバグでしょうか、、。ご教示のほど、宜しくお願い申し上げます。

なお、同じことをRで実装すると全く問題なく意図する結果となります。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

check解決した方法

0

済みません、上記ですが、以下2点により解決致しました。
①x_axis = np.linspace(0, 45,30) とする。
②for文終了後に、改めてx_axis = np.linspace(0, 45,30) とする。

②を行わない場合、なぜかx_axisの値もy_seqと同じになってしまい、
直線y=xのグラフになってしまいます(pythonのバグと思われます)。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/11/28 18:24

    多分Pythonのバグではないです。
    y_seq = x_axis
    の動作を理解してないのではないでしょうか?

    キャンセル

  • 2019/11/28 18:27

    バグではありません。
    ①はnumpyのたぶん明文化された仕様(リファレンスは拾っていないので、そういう記述がないかどうか探してみてください)。②は代入がコピーを作らないからで、Pythonの基本的な仕様です(参照:https://docs.python.org/ja/3/faq/programming.html#id17

    キャンセル

0

整数型のnumpy配列に小数点数を代入すると整数型に変換されます。

>>> import numpy as np
>>> a = np.arange(3)
>>> a
array([0, 1, 2])
>>> a.dtype
dtype('int64')
>>> a[0] = 1.414
>>> a
array([1, 1, 2])

対策:最初からnumpy.float64の配列にする。

>>> a = np.arange(3, dtype=np.float64)
>>> a
array([0., 1., 2.])
>>> a[0] = 1.414
>>> a
array([1.414, 1.   , 2.   ])

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.86%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる