お忙しい中申し訳ありません。
今、エクセルデータを使って回帰分析を行うプログラムを書いている
初心者ですが、画像のようにプログラムを書いてみたのですが、train scoreと
test scoreが非常に低い値となってしまいました。
このプログラムでおかしいところがありますでしょうか。
お答えしていただけると幸いです。
from pandas import Series,DataFrame import pandas as pd df = pd.read_csv('Liver.csv') df_X = df.copy() df_Y = df.copy() df_X = df_X.drop('Ao',axis=1) drop_idx = ['Height', 'Weight','age'] df_Y = df_Y.drop(drop_idx,axis=1) from sklearn.model_selection import train_test_split as split x_train, x_test, y_train, y_test = split(df_X,df_Y,train_size=0.8,test_size=0.2) from sklearn.linear_model import LogisticRegression from sklearn.tree import DecisionTreeClassifier model = DecisionTreeClassifier(max_depth=3) model.fit(x_train, y_train) print("train score:",model.score(x_train,y_train)) print("test score:",model.score(x_test,y_test))
読み込んだエクセルのデータはこちらです。
質問者さんがやりたいことは分類ではなく回帰では?
※コードは画像ではなく「コードの挿入」にてテキストで記入ください。
DecisionTreeClassifier を使っているだけなので、回帰分析はできていないのでは?
コメントありがとうございます。
参考にさせていただき、改めて修正していきたいと思います。