質問するログイン新規登録

質問編集履歴

1

不要な部分を削除

2019/10/09 16:32

投稿

dal
dal

スコア38

title CHANGED
@@ -1,1 +1,1 @@
1
- 【scikit-learn】Label EncoderとOne Hot Encoder(git_dummies)の使い分けについて
1
+ 【scikit-learn】Label EncoderとOne Hot Encoderの使い分けについて
body CHANGED
@@ -3,19 +3,19 @@
3
3
  scikit-learnには、カテゴリ変数を数値化するためのメソッドとして
4
4
 
5
5
  ・Label Encoder
6
- ・One Hot Encoder(git_dummies)
6
+ ・One Hot Encoder
7
7
 
8
8
  が存在しています。
9
9
 
10
10
  これらの使い分け方に関して詳しい方にお聞きしたいのですが、
11
- 分類の場合は`Label Encoder`を、回帰の場合は`One Hot Encoder(git_dummies)`を使うのが適切であるという解釈でよろしいのでしょうか?
11
+ 分類の場合は`Label Encoder`を、回帰の場合は`One Hot Encoder`を使うのが適切であるという解釈でよろしいのでしょうか?
12
12
 
13
13
  以上のように考えた理由としては、
14
14
  `Label Encoder`はカテゴリ変数をそのまま数値に置き換える
15
15
  →数値の大小が順序的意味を持ってしまう
16
16
  →数値を予測する回帰には思わしくない影響を与えてしまう(分類であれば問題なさそう?)
17
17
  という思考に陥ったからです。
18
- 逆に、`One Hot Encoder(git_dummies)`は、カテゴリ変数をダミー変数化(0・1のみに)してくれるため、順序的意味を持たずに済み、回帰にも使用できるのではないかと考えました。
18
+ 逆に、`One Hot Encoder`は、カテゴリ変数をダミー変数化(0・1のみに)してくれるため、順序的意味を持たずに済み、回帰にも使用できるのではないかと考えました。
19
19
 
20
20
 
21
21
  詳しい方がいましたら、以上の内容についてご教授いただきたいです。