目視によってV0からV4までの特徴のうち、3つを選択し終わった後の状態です。
これからロジスティック回帰を評価して見ようと思ったところ、エラーが発生してしまい調べても解決しませんでした。
エラー内容
ValueError: n_splits=10 cannot be greater than the number of members in each class.
どなたか解決方法分かる方いればよろしくお願いいたします。
Python
1df = pd.read_csv('python/sample.csv',encoding="shift-jis") 2##make matrix 3X = df[['V0','V2','V3']] 4y = df.Class 5 6##10-foldCV, LogisticRegression, PR_AUC 7pr_auc = cross_val_score(LogisticRegression(), X, y, scoring="average_precision", cv=10) 8print('各分割でのスコア:',pr_auc) 9print('\nその平均:',np.mean(pr_auc))
sample.csv
1 V0 V1 V2 V3 V4 Class 20 26 14.9 62.0 3 1 1 31 51 15.2 60.1 2 2 1 42 26 11.1 66.0 2 3 1 5 ・ 6 ・ 711 36 10.3 73.0 3 2 4
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。