機械学習の様々なモデルを試す中で決定木のモデルでエラーが出ており原因がわかりません。
ナイーブベイズ、ロジスティック回帰、ランダムフォレスト、knn,SVC,lightGBMなどはうまくいっており、aucスコアを得られています。
原因を解明して、エラーが出ているモデルでの予測をすることを目指しています。
よろしくお願いします。
# 決定木 from sklearn.tree import DecisionTreeClassifier clf = DecisionTreeClassifier(random_state=0) clf = clf.fit(X_train, y_train) pred = clf.predict(X_test) fpr, tpr, thresholds = metrics.roc_curve(y_test, pred, pos_label=1) auc=metrics.auc(fpr, tpr) auc #エラーコード ValueError Traceback (most recent call last) <ipython-input-8-f4fca059e899> in <module> 2 from sklearn.tree import DecisionTreeClassifier 3 clf = DecisionTreeClassifier(random_state=0) ----> 4 clf = clf.fit(X_train, y_train) 5 pred = clf.predict(X_test) 6 fpr, tpr, thresholds = metrics.roc_curve(y_test, pred, pos_label=1) ValueError: Unknown label type: 'continuous-multioutput'
追記です
features,targetはDataFrameでfeaturesが27000×33,target(中身は0か1)27000×1で全て数字です
featuresの中身はこのようなものです。見にくくて申し訳ありません。
features,targetの中身にNaNなどは入っていません。
features,targetを分割してX_train, X_test, y_train, y_testとしています。
credit age payment_9 payment_8 payment_7 payment_6 payment_5 payment_4 claim_9 claim_8 claim_7 claim_6 claim_5 claim_4 advance_9 advance_8 advance_7 advance_6 advance_5 advance_4 pay_condition_rate9 pay_condition_rate8 pay_condition_rate7 pay_condition_rate6 pay_condition_rate5 pay_late pay_late_count credit_age claim9 claim8 claim7 claim6 claim5
0 20000 24 2 2 -1 -1 -2 -2 3913 3102 689 0 0 0 0.0 0.03445 0.0 0.0 0.0 0 0.1551 0.0 0.0 0.0 0.0 1 4.0 833.333333 0.19565 0.1551 0.03445 0.0 0.0
X_train, X_test, y_train, y_test = train_test_split(features, target, test_size=0.2, random_state=1234)
回答1件