質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

345閲覧

csvデータから回帰係数を求める

haruhika

総合スコア14

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2019/06/27 09:49

下記のようなデータから、index毎に回帰係数を求めたいです。

data

1data=pd.DataFrame([[100,200,300,400,500],[100,200,300,400,500],[100,200,200,300,300], 2 [500,400,300,200,100],[500,400,300,200,100]], 3 columns=['1月','2月','3月','4月','5月'], 4 index=['A101','A102','A103','A104','A105'])

statsやlinear_modelを使用するのかと検討したのですが、データ構成方法から苦戦しております。。
index毎に、減少傾向なのか増加傾向なのかを確認するために求めたいです。

求め方についてご教授頂けますでしょうか。。よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

最小二乗法による単回帰分析でよければ、 numpy.linalg.lstsq() でも良いかと。

https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.lstsq.html

Python

1import pandas as pd 2import numpy as np 3import matplotlib.pyplot as plt 4 5data = pd.DataFrame( 6 [ 7 [100, 200, 300, 400, 500], 8 [100, 200, 300, 400, 500], 9 [100, 200, 200, 300, 300], 10 [500, 400, 300, 200, 100], 11 [500, 400, 300, 200, 100] 12 ], 13 columns=['1月', '2月', '3月', '4月', '5月'], 14 index=['A101', 'A102', 'A103', 'A104', 'A105']) 15 16A = np.vstack([range(data.shape[1]), np.ones(data.shape[1])]).T 17data = data.join(data.apply(lambda d: pd.Series(np.linalg.lstsq(A, d, rcond=None)[0], index=['w1', 'w0']), axis=1)) 18print(data) 19# 1月 2月 3月 4月 5月 w1 w0 20#A101 100 200 300 400 500 100.0 100.0 21#A102 100 200 300 400 500 100.0 100.0 22#A103 100 200 200 300 300 50.0 120.0 23#A104 500 400 300 200 100 -100.0 500.0 24#A105 500 400 300 200 100 -100.0 500.0 25 26# 一応確認 27fig, axs = plt.subplots(1, 5, figsize=[12,3]) 28for (name, d), ax in zip(data.iterrows(), axs): 29 x = np.arange(5) 30 f = lambda p: d.w0 + d.w1 * p 31 ax.plot(x, d[:5], '.') 32 ax.plot(x, f(x), '-') 33 ax.set_title(name) 34plt.show()

イメージ説明

投稿2019/06/28 00:09

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

haruhika

2019/06/28 01:37

ご丁寧な説明ありがとうございました。。 ・説明変数の用意 ・各行への単回帰分析の実行 こちらに苦戦していたので、助かりました。 ありがとうございました。
guest

0

index毎に、減少傾向なのか増加傾向なのかを確認するために求めたいです。

とのことでしたので単回帰分析を利用するのが早そうですね
単回帰分析なら、Scikit-learn を使ってみるのはいかがでしょうか?
https://algorithm.joho.info/machine-learning/python-scikit-learn-regression-single/

投稿2019/06/27 10:58

編集2019/06/27 10:58
Kazuyuki-T0806

総合スコア326

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

haruhika

2019/06/28 01:40

コメントありがとうございます! はい、Scikit-learnのlinear_modelを使って検討しておりました。 URLありがとうございます!
guest

0

ネット検索を活用すれば、回帰係数の求め方は分かると思います。

もし、分からなかったら、分からなかったところを明示したら、その先の求め方も教えてもらえると思います。

投稿2019/06/27 10:48

sage

総合スコア1216

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

haruhika

2019/06/28 01:39

質問内容が不十分で申し訳ございませんでした。 回帰係数の求め方は、調べてすぐわかりましたが、 ・説明変数の用意 ・データフレームを使用し、各行への単回帰分析の実行 に苦戦していることを書くべきでした。。 (データ構成方法から苦戦しております。。 だけでは不十分でした。。)
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問