ランダムフォレストでモデルを構築し、交差検証法を使って検証を行いました。
使用したのはscikit.learnです。
python
1clf = RandomForestClassifier(n_estimators=100,random_state=0)
python
1scores = cross_val_score(clf, x, y, cv=10)
交差検証法では、ある程度満足できる結果が出ました。
しかし、テストデータにも訓練データにもない未知データを構築したモデル(ランダムフォレスト)に与えると交差検証法で出た値を下回る結果しかでません。
なぜこういったことが起きるのか、理由がわかりません。
もしわかる方がいらっしゃればご教授よろしくお願いします。
タグに「機械学習」などを加えたほうが、回答を得やすい質問だと思います。
回答1件
あなたの回答
tips
プレビュー