teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

3

ミスを修正しました。

2021/04/11 12:57

投稿

BoKuToTuZenU
BoKuToTuZenU

スコア51

answer CHANGED
@@ -9,9 +9,28 @@
9
9
  ...
10
10
 
11
11
  のような感じです。
12
- この、データは`csv`ファイルであると思いますので、`pandas`を用いれば簡単に変換することができます。
12
+ この、データは`csv`ファイルであると思いますので、`pandas`を用いれば変換することができます。
13
13
  `pd.get_dummies(df)`
14
14
  を用いれば変換できます([ドキュメント](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html))。
15
+
16
+ # 追記
17
+ `pd.get_dummies`はラベルエンコーディングの後にone-hotに変更します。
18
+ そのため、
19
+ `a`,`b`,`c`,`d`などのカテゴリがある場合、
20
+ `a->0`,`b->1`,`c->2`,`d->3`
21
+ などと番号付を行います。
22
+ その後に
23
+ ```
24
+ a-> [1,0,0,0]
25
+ b-> [0,1,0,0]
26
+ c-> [0,0,1,0]
27
+ d-> [0,0,0,1]
28
+ ```
29
+
30
+ などのようにone-hotのベクトルに変更する処理を行います。
31
+ -> 追記終わり
32
+
33
+
15
34
  これは、データ型dtypeがobject(おもに文字列)またはcategoryである列がすべてダミー変数化されます。
16
35
  これを用いることで機械学習のモデル(sklearnの決定木でしょうか?)に入力することができるかと思います。
17
36
 

2

詳しく書いた

2021/04/11 12:56

投稿

BoKuToTuZenU
BoKuToTuZenU

スコア51

answer CHANGED
@@ -15,4 +15,5 @@
15
15
  これは、データ型dtypeがobject(おもに文字列)またはcategoryである列がすべてダミー変数化されます。
16
16
  これを用いることで機械学習のモデル(sklearnの決定木でしょうか?)に入力することができるかと思います。
17
17
 
18
- また、質問する際にコードやエラーの部分は、バッククオート(```)を3つつけたもので囲むと良いかと思います。
18
+ また、質問する際にコードやエラーの部分は、バッククオート(```)を3つつけたもので囲むと良いかと思います。
19
+ [詳しい書き方](https://teratail.com/help/question-tips)を参照していただけたらと思います。

1

ミスを修正しました。

2021/04/11 12:39

投稿

BoKuToTuZenU
BoKuToTuZenU

スコア51

answer CHANGED
@@ -13,4 +13,6 @@
13
13
  `pd.get_dummies(df)`
14
14
  を用いれば変換できます([ドキュメント](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html))。
15
15
  これは、データ型dtypeがobject(おもに文字列)またはcategoryである列がすべてダミー変数化されます。
16
- これを用いることで機械学習のモデル(sklearnの決定木でしょうか?)に入力することができるかと思います。
16
+ これを用いることで機械学習のモデル(sklearnの決定木でしょうか?)に入力することができるかと思います。
17
+
18
+ また、質問する際にコードやエラーの部分は、バッククオート(```)を3つつけたもので囲むと良いかと思います。