回答編集履歴
2
修正
test
CHANGED
@@ -1,18 +1,16 @@
|
|
1
|
-
回帰分析については
|
1
|
+
回帰分析については詳しくありませんが、~~t値の求め方~~**元のデータが標準化されていない**ことが原因だと思われます。
|
2
|
-
|
3
2
|
提示コードでは以下などを参考に係数(coef)のみから求めていると思います。
|
4
3
|
- [回帰分析のt値の求め方:Pythonで実装](https://betashort-lab.com/%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%82%B9/%E7%B5%B1%E8%A8%88%E5%AD%A6/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%E3%81%AEt%E5%80%A4/)
|
5
4
|
- [[Docker, Python] (重回帰分析編, sk-learn, t値算出, 忘備録)](https://baran-gizagiza.com/docker-python-twitter-t_value/)
|
5
|
+
|
6
|
+
上記の場合、事前にデータを標準化することで切片項がなくなって正しい結果が得られるようです。
|
7
|
+
参考:[【重回帰分析】標準化と切片の扱いについて (表現の違いについて)](https://mathmatical22.xyz/2020/02/26/%E3%80%90%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%E3%80%91%E6%A8%99%E6%BA%96%E5%8C%96%E3%81%A8%E5%88%87%E7%89%87%E3%81%AE%E6%89%B1%E3%81%84%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6-%E8%A1%A8%E7%8F%BE/)
|
6
8
|
|
7
9
|
いっぽう以下では切片(intercept)も含めて求めるようなコードになっています。
|
8
10
|
- [Find p-value (significance) in scikit-learn LinearRegression](https://stackoverflow.com/a/42677750)
|
9
11
|
- [回帰係数のp値とt値が不明なときに、p値とt値を求める方法](https://www.psychoinformatics.info/single-post/%E5%9B%9E%E5%B8%B0%E4%BF%82%E6%95%B0%E3%81%AEp%E5%80%A4%E3%81%A8t%E5%80%A4%E3%81%8C%E4%B8%8D%E6%98%8E%E3%81%AA%E3%81%A8%E3%81%8D%E3%81%AB%E3%80%81p%E5%80%A4%E3%81%A8t%E5%80%A4%E3%82%92%E6%B1%82%E3%82%81%E3%82%8B%E6%96%B9%E6%B3%95-python)
|
10
12
|
|
11
|
-
|
12
|
-
|
13
|
-
なお、提示コードでは、事前にデータを標準化することで切片項がなくなって正しい結果が得られるようです。
|
14
|
-
参考:[【重回帰分析】標準化と切片の扱いについて (表現の違いについて)](https://mathmatical22.xyz/2020/02/26/%E3%80%90%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%E3%80%91%E6%A8%99%E6%BA%96%E5%8C%96%E3%81%A8%E5%88%87%E7%89%87%E3%81%AE%E6%89%B1%E3%81%84%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6-%E8%A1%A8%E7%8F%BE/)
|
15
|
-
|
13
|
+
この方法であれば元のデータのままでも[statsmodels.regression.linear_model.OLS](https://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.html)での結果と一致します。
|
16
14
|
```Python
|
17
15
|
import numpy as np
|
18
16
|
import pandas as pd
|
1
追記
test
CHANGED
@@ -10,6 +10,8 @@
|
|
10
10
|
|
11
11
|
理論、数式などはまったく理解できていませんが、この方法であれば[statsmodels.regression.linear_model.OLS](https://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.html)での結果と一致します。
|
12
12
|
|
13
|
+
なお、提示コードでは、事前にデータを標準化することで切片項がなくなって正しい結果が得られるようです。
|
14
|
+
参考:[【重回帰分析】標準化と切片の扱いについて (表現の違いについて)](https://mathmatical22.xyz/2020/02/26/%E3%80%90%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%E3%80%91%E6%A8%99%E6%BA%96%E5%8C%96%E3%81%A8%E5%88%87%E7%89%87%E3%81%AE%E6%89%B1%E3%81%84%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6-%E8%A1%A8%E7%8F%BE/)
|
13
15
|
|
14
16
|
```Python
|
15
17
|
import numpy as np
|