機械学習法の一つであるサポートベクター回帰で、解析するデータは50~150とラベル付けされることが予想されるデータを解析するときの教師データの与え方についての質問です。
私は、50~150とラベル付けされているものを教師データとして利用するのが良いと考えていたのですが、教師データの与え方を複数検討してみたところ、外れた値を含むラベル(0~200)のデータを教師データの与えた方が解析の正確度が向上する傾向が見られました。
結果としてこうなることは分かったのですが、考えられる理由が何かありましたら是非聞かせていただきたいです。
よろしくお願い致します。
追記:データセットは標準化を行っています。
pythonタグより、機械学習タグの方が適当かと
回答2件
あなたの回答
tips
プレビュー