質問編集履歴
1
不要な部分を削除
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
【scikit-learn】Label EncoderとOne Hot Encoder
|
1
|
+
【scikit-learn】Label EncoderとOne Hot Encoderの使い分けについて
|
body
CHANGED
@@ -3,19 +3,19 @@
|
|
3
3
|
scikit-learnには、カテゴリ変数を数値化するためのメソッドとして
|
4
4
|
|
5
5
|
・Label Encoder
|
6
|
-
・One Hot Encoder
|
6
|
+
・One Hot Encoder
|
7
7
|
|
8
8
|
が存在しています。
|
9
9
|
|
10
10
|
これらの使い分け方に関して詳しい方にお聞きしたいのですが、
|
11
|
-
分類の場合は`Label Encoder`を、回帰の場合は`One Hot Encoder
|
11
|
+
分類の場合は`Label Encoder`を、回帰の場合は`One Hot Encoder`を使うのが適切であるという解釈でよろしいのでしょうか?
|
12
12
|
|
13
13
|
以上のように考えた理由としては、
|
14
14
|
`Label Encoder`はカテゴリ変数をそのまま数値に置き換える
|
15
15
|
→数値の大小が順序的意味を持ってしまう
|
16
16
|
→数値を予測する回帰には思わしくない影響を与えてしまう(分類であれば問題なさそう?)
|
17
17
|
という思考に陥ったからです。
|
18
|
-
逆に、`One Hot Encoder
|
18
|
+
逆に、`One Hot Encoder`は、カテゴリ変数をダミー変数化(0・1のみに)してくれるため、順序的意味を持たずに済み、回帰にも使用できるのではないかと考えました。
|
19
19
|
|
20
20
|
|
21
21
|
詳しい方がいましたら、以上の内容についてご教授いただきたいです。
|