交差検証法についての質問

回答率: 85.48%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.48%

トップ Python 3.xに関する質問

Q&A

解決済

1回答

1844閲覧

交差検証法についての質問

総合スコア38

0グッド

0クリップ

投稿2016/12/26 17:39

編集2016/12/27 05:09

0

0

ランダムフォレストでモデルを構築し、交差検証法を使って検証を行いました。
使用したのはscikit.learnです。

python
1clf = RandomForestClassifier(n_estimators=100,random_state=0)

python
1scores = cross_val_score(clf, x, y, cv=10)

交差検証法では、ある程度満足できる結果が出ました。
しかし、テストデータにも訓練データにもない未知データを構築したモデル（ランダムフォレスト）に与えると交差検証法で出た値を下回る結果しかでません。

なぜこういったことが起きるのか、理由がわかりません。

もしわかる方がいらっしゃればご教授よろしくお願いします。

2016/12/27 01:31

タグに「機械学習」などを加えたほうが、回答を得やすい質問だと思います。

行動規範の内容に同意します

回答1件

0

ベストアンサー

既知データ(in-samples)に対して過学習を回避しつつ予測器を構築しただけですから、未知データ(out-of-samples)がどのような構造を持っているのかについて、予測器には何ら情報が入っていません。なので予測精度が落ちるのは当然です。予測精度が「著しく落ちない」のは未知データが既知データと似た特性を持っている時だけです。

投稿2016/12/27 11:16

総合スコア1582

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Python 3.xに関する質問

交差検証法についての質問

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【サポート業務のお知らせ】ゴールデンウィーク休業につき下記の日程で、お問い合わせ等のサポート業務をお休みいたします。 2024/04/27(土)~2024/04/29(月) 2024/05/03(金)〜2024/05/06(月) なお期間中もサポートへのお問い合わせは受け付けております。

【重要なお知らせ】いつもteratailをご利用いただきありがとうございます。現在、認証システムの修正により、一部のユーザーが強制的にログアウトされる可能性がございます。お手数おかけしますが、再度ログインを行なっていただきますよう宜しくお願いいたします。ご不便をおかけし申し訳ございません。

過去のお知らせを見る