実現したいこと
python scikit-learn を使って、2次項の重回帰の係数、切片を求めました。目的変数値を上記で求めた係数、切片と、説明変数のどれかの値を代入して求めたいです。
下記のサンプルコードのように、説明変数の数が3つで2次項の回帰の場合、係数の数は9つになります。9つの係数と、切片と、元データの0行目の、X1、X2、x3 の値を使って、目的変数を算出したいですが、9つの係数と切片は出ているのですが、元データの、X1、X2、X3、X1^2、X1 X2、X1 X3、X2^2、X2 X3、X3^2 に対応する値を出したいです。これらを計算する方法、もしくは、関数はないでしょうか?
該当のソースコード
python
1import pandas as pd 2import numpy as np 3import sklearn 4from sklearn.linear_model import LinearRegression 5from sklearn.preprocessing import PolynomialFeatures 6from sklearn.preprocessing import StandardScaler 7 8df_test = pd.DataFrame([[10,20,30,1010],[11,21,31,1100],[12,22,32,1020],[13,23,33,1200],[14,24,34,1030]],columns=['X1','X2','X3','Y']) 9df_test = pd.DataFrame(df_test) 10 11 X1 X2 X3 Y 120 10 20 30 1010 131 11 21 31 1100 142 12 22 32 1020 153 13 23 33 1200 164 14 24 34 1030 17 18#説明変数のデータフレーム 19df_setsumei_test = df_test.iloc[:,0:-1] 20#目的変数のデータフレーム 21df_mokuteki_test = df_test.iloc[:,3] 22 23# 説明変数と目的変数の設定 24X = df_setsumei_test.iloc[:,:] 25Y = df_mokuteki_test.iloc[:] 26 27#次数の設定 28poly = PolynomialFeatures(degree=2, include_bias=False) 29 30X = poly.fit_transform(X) 31 32# モデルの作成と学習 33model = LinearRegression() 34model.fit(X, Y) 35 36#説明変数の項目名と係数を出力する 37feature_names = poly.get_feature_names_out(input_features=df_setsumei_test.columns) 38coefficients = pd.Series(model.coef_, index=feature_names) 39print('2次の説明変数と項目') 40print(coefficients) 41 422次の説明変数と項目 43X1 0.828657 44X2 0.828657 45X3 0.828657 46X1^2 -19.668376 47X1 X2 -11.381807 48X1 X3 -3.095238 49X2^2 -3.095238 50X2 X3 5.191331 51X3^2 13.477900 52

回答1件
あなたの回答
tips
プレビュー