質問編集履歴

1

データ数について追記しました。

2018/01/25 02:07

投稿

MasaKoba
MasaKoba

スコア18

test CHANGED
File without changes
test CHANGED
@@ -3,6 +3,8 @@
3
3
  python 初心者です。ざっくりとした質問で恐縮なのですが、現在、予測モデルをつくっています。
4
4
 
5
5
  いろんな要素(データ)を加えていけばいくほど、accuracy_score値が上がっていくのですが、実際にpred_test = clf.predict(test_x)で予測値を出すとデータを加えていってもさほど変わらない、もしくは外れ度合が大きくなります。特に「過学習」ということでもない気がするのですが、考えられる理由はございますでしょうか。もし、少しでも考えられる可能性があるものがあればご教示いただけますと幸いです。何卒よろしくお願いいたします。
6
+
7
+ ※データ数は、各コラム(各要素)、3000~20000くらいございます。
6
8
 
7
9
 
8
10