回答率: 85.30%

質問するログイン新規登録

トップ機械学習に関する質問

Q&A

解決済

1回答

2418閲覧

回帰分析の標準回帰係数が大きすぎる:python linerregression

総合スコア4

0グッド

0クリップ

投稿2020/05/25 00:22

編集2020/05/25 00:23

0

0

###データセット
x.shape
出力：(53, 17)
y.shape
出力：(53,)

###skleanによるlinerregression
autoscaled_y = (y - y.mean()) / y.std()
autoscaled_x = (x - x.mean()) / x.std()

from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(autoscaled_x, autoscaled_y)

出力：LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

standard_regression_coefficients = pd.DataFrame(model.coef_)
standard_regression_coefficients.index = x.columns
standard_regression_coefficients.columns = ['standard_regression_coefficients']

standard_regression_coefficients
出力：
standard_regression_coefficients
1 2.526109e+06
2 2.576842e+06
3 5.998161e+05
//
53

以上のように試したところ、標準回帰係数がe+06などとても高く出ます。一般的な例だと±１程度をよく見る気がするのですが、説明変数(17)に対してサンプル数(53)が少なすぎるなど関係があるのでしょうか。この係数が異常に高くなる要因についてご存じの方いらっしゃいましたら教えていただきたく思います。よろしくお願いいたします。

行動規範の内容に同意します

回答1件

0

自己解決

恐らく多重共線性のためかと至りました。ここまで係数が大きくなってしまうと、係数を解釈することにはあまり意味がなくなってしまうため、この場合は原因となる要素を除くか、回帰法を変えるしかないようですね。

投稿2020/05/26 07:55

総合スコア4

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ機械学習に関する質問

回帰分析の標準回帰係数が大きすぎる:python linerregression

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【祝・teratail11周年！🎉】いつもteratailをご利用いただき誠にありがとうございます。おかげさまでteratailは、2025年7月16日でリリースから11周年を迎えました！🎊 これまでサービスを支えてくださった皆さまに、心から感謝いたします。その感謝を込めて、特別コンテンツを公開します✨ ／ ①1年間の活躍ユーザー＆話題のQ&Aランキングをご紹介！ ②オフラインイベント「集まっtail #2025」開催告知！＼詳細はteratail公式ブログよりご確認ください👀👇 https://blog.teratail.com/entry/11th-anniversary 今後ともteratailをよろしくお願いいたします。

過去のお知らせを見る