時系列データの機械学習について、
過学習しているのか?それともそもそも無理な課題なのか?
どちらか分からなくて質問させていただきます。
学習した結果の混同行列は以下の通りです。
【trainデータ】
[[1453 | 114]
[ 8 | 506]]
class | precision | recall | f1-score | support
0 | 0.99 | 0.93 | 0.96 | 1567
1 | 0.82 | 0.98 | 0.89 | 514
【testデータ】
[[311 | 81]
[ 89 | 40]]
class | precision | recall | f1-score | support
0 | 0.78 | 0.79 | 0.79 | 392
1 | 0.33 | 0.31 | 0.32 | 129
お聞きしたいことは、
①trainデータでは上手く分類できているように見えるが(一応、0.8以上あれば十分としている)、
testデータではあまり上手くいってないので過学習しているのは分かる。
これは
「過学習はしているけれど、そもそもは分類できないような問題ではない」
とこの結果から言ってよいのかどうか?
自分の感想としては、
trainデータで未学習の状態ではないので
そもそも分類できないような課題だ、とはいえないと一応思っています。
②もし過学習しているだけならば、
過学習の問題さえクリアすればtestデータでも汎化できそうな課題かどうか?
それとも過学習の問題ではなく
そもそも分類が無理な課題でありそうかどうか?(この混同行列を見た感じ)
の2点です。
宜しくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/08/01 03:17
2018/08/02 03:45
2018/08/02 06:11
2018/08/03 14:14
2018/08/03 16:36
2018/08/03 16:43