機械学習の勉強をしているものです。
3種類以上のカテゴリ変数を特徴量エンジニアリングする場合に、単純に数値変換してしまうと
機械学習アルゴリズムが存在しない大小関係を学んでしまう恐れがあるためone-hotエンコーディング
を用いることを学びました。
ここで疑問なのですが、2種類のカテゴリ変数では同様の問題は発生しないのでしょうか。
例えばmale
とfemale
という変数を0
と1
に変換した場合に、アルゴリズムがmale
はfemale
より1小さいと学んでしまうなどです。
0と1だけの場合には勝手に真偽値扱いされるのでしょうか。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/04/06 14:37
2020/04/06 16:11 編集
2020/04/06 16:22 編集
2020/04/07 22:23