購買データを用いてある商品を買うか買わないかの二値分類をしようとしています。
変数にはユーザー属性(性別や年齢)と過去の行動情報を入れています。
LightGBMにて変数重要度を算出した際に、来店回数だけかなり高くなってしまって他の変数の重要度が測れないといった状況になります。
この場合
- 1つの変数だけかなり高くなってしまうのはモデルとして正しくないのか
- この場合、来店回数だけ除いて再度変数重要度を測るのはおかしいか
- 重要度が高すぎる変数をどのように対処すれば良いのか
機械学習関連の知識が浅いので初学者として以上をご教授いただけると幸いです。
よろしくお願い致します。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。