回答率: 85.36%

質問するログイン新規登録

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／

詳細はこちら

トップ機械学習に関する質問

Q&A

解決済

1回答

888閲覧

pythonでのデータの前処理

総合スコア16

0グッド

0クリップ

投稿2019/09/20 07:47

0

0

pythonのscikit-learnを用いて重回帰分析を行っています。
データの特徴量の数に偏りがありそれに適合してしまい精度が低くなってしまいます。
価格:
0-50:1000個
50-75:15000個
75-100:1000個
100-:500個
のような感じです。
均等にデータが散らばるように多すぎる範囲のデータを消去することはできますか？

補足情報

非線形のランダムフォレストなどでは精度の高いモデルが作れたのですが、線形で作成したいです。

2019/09/20 12:33

説明変数と目的変数を教えて下さい。

行動規範の内容に同意します

回答1件

0

ベストアンサー

ロス関数に、特徴量の個数の偏りを考慮した重み係数を導入すれば解決します。

投稿2019/09/21 00:17

総合スコア1582

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ機械学習に関する質問

pythonでのデータの前処理