回答編集履歴

2

修正

2023/03/24 08:11

投稿

can110
can110

スコア38262

test CHANGED
@@ -1,18 +1,16 @@
1
- 回帰分析についてはまったく詳しくありませんが、t値の求め方に問題あると思われます。
1
+ 回帰分析については詳しくありませんが、~~t値の求め方~~**元のデータ標準化されていない**こが原因だと思われます。
2
-
3
2
  提示コードでは以下などを参考に係数(coef)のみから求めていると思います。
4
3
  - [回帰分析のt値の求め方:Pythonで実装](https://betashort-lab.com/%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%82%B9/%E7%B5%B1%E8%A8%88%E5%AD%A6/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%E3%81%AEt%E5%80%A4/)
5
4
  - [[Docker, Python] (重回帰分析編, sk-learn, t値算出, 忘備録)](https://baran-gizagiza.com/docker-python-twitter-t_value/)
5
+
6
+ 上記の場合、事前にデータを標準化することで切片項がなくなって正しい結果が得られるようです。
7
+ 参考:[【重回帰分析】標準化と切片の扱いについて (表現の違いについて)](https://mathmatical22.xyz/2020/02/26/%E3%80%90%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%E3%80%91%E6%A8%99%E6%BA%96%E5%8C%96%E3%81%A8%E5%88%87%E7%89%87%E3%81%AE%E6%89%B1%E3%81%84%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6-%E8%A1%A8%E7%8F%BE/)
6
8
 
7
9
  いっぽう以下では切片(intercept)も含めて求めるようなコードになっています。
8
10
  - [Find p-value (significance) in scikit-learn LinearRegression](https://stackoverflow.com/a/42677750)
9
11
  - [回帰係数のp値とt値が不明なときに、p値とt値を求める方法](https://www.psychoinformatics.info/single-post/%E5%9B%9E%E5%B8%B0%E4%BF%82%E6%95%B0%E3%81%AEp%E5%80%A4%E3%81%A8t%E5%80%A4%E3%81%8C%E4%B8%8D%E6%98%8E%E3%81%AA%E3%81%A8%E3%81%8D%E3%81%AB%E3%80%81p%E5%80%A4%E3%81%A8t%E5%80%A4%E3%82%92%E6%B1%82%E3%82%81%E3%82%8B%E6%96%B9%E6%B3%95-python)
10
12
 
11
- 理論、数式などはまったく理解できていませんが、この方法であれば[statsmodels.regression.linear_model.OLS](https://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.html)での結果と一致します。
12
-
13
- なお、提示コードでは、事前にデータを標準化することで切片項がなくなって正しい結果が得られるようです。
14
- 参考:[【重回帰分析】標準化と切片の扱いについて (表現の違いについて)](https://mathmatical22.xyz/2020/02/26/%E3%80%90%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%E3%80%91%E6%A8%99%E6%BA%96%E5%8C%96%E3%81%A8%E5%88%87%E7%89%87%E3%81%AE%E6%89%B1%E3%81%84%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6-%E8%A1%A8%E7%8F%BE/)
15
-
13
+ この方法であれば元のデータのままでも[statsmodels.regression.linear_model.OLS](https://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.html)での結果と一致します。
16
14
  ```Python
17
15
  import numpy as np
18
16
  import pandas as pd

1

追記

2023/03/24 06:08

投稿

can110
can110

スコア38262

test CHANGED
@@ -10,6 +10,8 @@
10
10
 
11
11
  理論、数式などはまったく理解できていませんが、この方法であれば[statsmodels.regression.linear_model.OLS](https://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.html)での結果と一致します。
12
12
 
13
+ なお、提示コードでは、事前にデータを標準化することで切片項がなくなって正しい結果が得られるようです。
14
+ 参考:[【重回帰分析】標準化と切片の扱いについて (表現の違いについて)](https://mathmatical22.xyz/2020/02/26/%E3%80%90%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%E3%80%91%E6%A8%99%E6%BA%96%E5%8C%96%E3%81%A8%E5%88%87%E7%89%87%E3%81%AE%E6%89%B1%E3%81%84%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6-%E8%A1%A8%E7%8F%BE/)
13
15
 
14
16
  ```Python
15
17
  import numpy as np