機械学習の特徴量エンジニアリングで大量のブランドidを扱うのですが、全部をダミー変数にすると多すぎるので、なるべく量的変数に変換したいと考えています。
一案としてはブランドidと対のブランド名をword2vecで類似度に変換して量的変数化する方法を考えています。
何か大量のカテゴリ変数(id)を量的変数に変換する方法でいい方法はないでしょうか?
ご教授お願いします
聞きたいことが変わったのなら、質問の内容を抹消して書き直すのではなく、別に質問を立ててください。この質問は元の状態に戻した後、自己解決なら自己解決にして解決方法を書き、そうでなければ(その情報が必要なくなった、というのもこれに含みます)しばらくは未解決のままにしておいてください
回答1件
あなたの回答
tips
プレビュー