pythonのscikit-learnを用いて重回帰分析を行っています。
データの特徴量の数に偏りがありそれに適合してしまい精度が低くなってしまいます。
価格:
0-50:1000個
50-75:15000個
75-100:1000個
100-:500個
のような感じです。
均等にデータが散らばるように多すぎる範囲のデータを消去することはできますか?
補足情報
非線形のランダムフォレストなどでは精度の高いモデルが作れたのですが、線形で作成したいです。
回答1件
あなたの回答
tips
プレビュー