質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

1回答

1837閲覧

交差検証法についての質問

doz13189

総合スコア38

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2016/12/26 17:39

編集2016/12/27 05:09

ランダムフォレストでモデルを構築し、交差検証法を使って検証を行いました。
使用したのはscikit.learnです。

python

1clf = RandomForestClassifier(n_estimators=100,random_state=0)

python

1scores = cross_val_score(clf, x, y, cv=10)

交差検証法では、ある程度満足できる結果が出ました。
しかし、テストデータにも訓練データにもない未知データを構築したモデル(ランダムフォレスト)に与えると交差検証法で出た値を下回る結果しかでません。

なぜこういったことが起きるのか、理由がわかりません。

もしわかる方がいらっしゃればご教授よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jcs502ulf

2016/12/27 01:31

タグに「機械学習」などを加えたほうが、回答を得やすい質問だと思います。
guest

回答1

0

ベストアンサー

既知データ(in-samples)に対して過学習を回避しつつ予測器を構築しただけですから、未知データ(out-of-samples)がどのような構造を持っているのかについて、予測器には何ら情報が入っていません。なので予測精度が落ちるのは当然です。予測精度が「著しく落ちない」のは未知データが既知データと似た特性を持っている時だけです。

投稿2016/12/27 11:16

WathMorks

総合スコア1582

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問