エクセルファイルを用いたランダムフォレストによる回帰分析

お忙しい中、大変申し訳ありません。
エクセルデータを読み込んでランダムフォレストで回帰分析を行うプログラムを書いている最中なのですが、
rg scoreが-0.38とマイナスで低い値となってしまいます。下記のプログラムでおかしいところはありますでしょうか。

from
1import pandas as pd
2df = pd.read_csv('Liver.csv')
3df_X = df.copy()
4df_Y = df.copy()
5df_X = df_X.drop('Ao',axis=1)
6drop_idx = ['Height', 'Weight','age']
7df_Y = df_Y.drop(drop_idx,axis=1)
8from sklearn.model_selection import train_test_split as split
9x_train, x_test, y_train, y_test = split(df_X,df_Y,train_size=0.8,test_size=0.2)
10from sklearn import datasets
11import numpy as np
12import matplotlib.pyplot as plt
13from sklearn.ensemble import RandomForestRegressor as RFR
14from sklearn.model_selection import train_test_split, GridSearchCV
15rg = RFR(n_jobs=-1, random_state=2525)
16rg.fit(x_train,y_train)
17predicted_test= rg.predict(x_test)
18rg.score(x_test, y_test)
19
20-0.3800381696021844
21
22plt.figure(figsize=(20,10))
23plt.plot(y_test,label="True")
24plt.plot(predicted_test, label="predicted")
25

読み込んだエクセルデータはこちらです。

どうかご教授の程よろしくお願いいたします。

jbpb0

2022/04/21 22:05

rg.score(x_train,y_train) の結果はいくつでしょうか？

ysdmst

2022/04/21 22:22

ご回答の程ありがとうございます。 0.8342となりました。

jbpb0

2022/04/21 22:29

過学習になってるようです質問のコードで表示されるグラフと、下記コードを実行して表示されるグラフで、「True」と「predicted」の近さ(予測の正しさ)を比べてみてください predicted_train= rg.predict(x_train) plt.figure(figsize=(20,10)) plt.plot(y_train,label="True") plt.plot(predicted_train, label="predicted") 質問のコードのグラフはあまり合ってないけど、上記コードのグラフはそこそこ合ってるのではありませんか？

ysdmst

2022/04/22 09:37

お忙しい中のご回答ありがとうございます。合っていました。過学習になっているのでしょうか。この場合は、ランダムフォレストのパラメータを調整するしかないのでしょうか？

jbpb0

2022/04/29 02:15

ランダムフォレストでやるのにこだわるのなら、データを増やすか、ハイパーパラメータを変えてみるか、ですね

行動規範の内容に同意します

回答1件

rg.score(x_test, y_test)
-0.3800381696021844

　
rg.score(x_train,y_train)

0.8342となりました。

過学習になってるようです

投稿2022/05/09 06:29

jbpb0

総合スコア7658

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

エクセルファイルを用いたランダムフォレストによる回帰分析

関連した質問