質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

680閲覧

フィルター法の実装中のエラー

Chuchuchu

総合スコア16

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/06/17 13:15

目視によってV0からV4までの特徴のうち、3つを選択し終わった後の状態です。
これからロジスティック回帰を評価して見ようと思ったところ、エラーが発生してしまい調べても解決しませんでした。
エラー内容
ValueError: n_splits=10 cannot be greater than the number of members in each class.

どなたか解決方法分かる方いればよろしくお願いいたします。

Python

1df = pd.read_csv('python/sample.csv',encoding="shift-jis") 2##make matrix 3X = df[['V0','V2','V3']] 4y = df.Class 5 6##10-foldCV, LogisticRegression, PR_AUC 7pr_auc = cross_val_score(LogisticRegression(), X, y, scoring="average_precision", cv=10) 8print('各分割でのスコア:',pr_auc) 9print('\nその平均:',np.mean(pr_auc))

sample.csv

1 V0 V1 V2 V3 V4 Class 20 26 14.9 62.0 3 1 1 31 51 15.2 60.1 2 2 1 42 26 11.1 66.0 2 3 1 56711 36 10.3 73.0 3 2 4      

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

ValueError: n_splits=10 cannot be greater than the number of members in each class

値エラー: n_splits は各クラスのサンプル数より大きい数を指定することはできません。

サンプルが10個未満のクラスがあるなら、n_splits=10 でクロスバリデーションは行なえません。
なぜなら、10分割したグループのうち、1つもサンプルがないクラスが含まれるグループが出てきてしまうからです。

例えば、5個しかないお菓子を8人に配ったら、お菓子がもらえない人が出てきますよね。(鳩の巣原理)

12個しかサンプルがないなら、クロスバリデーションするには数が少なすぎるので、やめたほうがいいかと思います。

投稿2019/06/17 13:25

編集2019/06/17 13:30
tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問