回答編集履歴
3
ミスを修正しました。
answer
CHANGED
@@ -9,9 +9,28 @@
|
|
9
9
|
...
|
10
10
|
|
11
11
|
のような感じです。
|
12
|
-
この、データは`csv`ファイルであると思いますので、`pandas`を用いれば
|
12
|
+
この、データは`csv`ファイルであると思いますので、`pandas`を用いれば変換することができます。
|
13
13
|
`pd.get_dummies(df)`
|
14
14
|
を用いれば変換できます([ドキュメント](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html))。
|
15
|
+
|
16
|
+
# 追記
|
17
|
+
`pd.get_dummies`はラベルエンコーディングの後にone-hotに変更します。
|
18
|
+
そのため、
|
19
|
+
`a`,`b`,`c`,`d`などのカテゴリがある場合、
|
20
|
+
`a->0`,`b->1`,`c->2`,`d->3`
|
21
|
+
などと番号付を行います。
|
22
|
+
その後に
|
23
|
+
```
|
24
|
+
a-> [1,0,0,0]
|
25
|
+
b-> [0,1,0,0]
|
26
|
+
c-> [0,0,1,0]
|
27
|
+
d-> [0,0,0,1]
|
28
|
+
```
|
29
|
+
|
30
|
+
などのようにone-hotのベクトルに変更する処理を行います。
|
31
|
+
-> 追記終わり
|
32
|
+
|
33
|
+
|
15
34
|
これは、データ型dtypeがobject(おもに文字列)またはcategoryである列がすべてダミー変数化されます。
|
16
35
|
これを用いることで機械学習のモデル(sklearnの決定木でしょうか?)に入力することができるかと思います。
|
17
36
|
|
2
詳しく書いた
answer
CHANGED
@@ -15,4 +15,5 @@
|
|
15
15
|
これは、データ型dtypeがobject(おもに文字列)またはcategoryである列がすべてダミー変数化されます。
|
16
16
|
これを用いることで機械学習のモデル(sklearnの決定木でしょうか?)に入力することができるかと思います。
|
17
17
|
|
18
|
-
また、質問する際にコードやエラーの部分は、バッククオート(```)を3つつけたもので囲むと良いかと思います。
|
18
|
+
また、質問する際にコードやエラーの部分は、バッククオート(```)を3つつけたもので囲むと良いかと思います。
|
19
|
+
[詳しい書き方](https://teratail.com/help/question-tips)を参照していただけたらと思います。
|
1
ミスを修正しました。
answer
CHANGED
@@ -13,4 +13,6 @@
|
|
13
13
|
`pd.get_dummies(df)`
|
14
14
|
を用いれば変換できます([ドキュメント](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html))。
|
15
15
|
これは、データ型dtypeがobject(おもに文字列)またはcategoryである列がすべてダミー変数化されます。
|
16
|
-
これを用いることで機械学習のモデル(sklearnの決定木でしょうか?)に入力することができるかと思います。
|
16
|
+
これを用いることで機械学習のモデル(sklearnの決定木でしょうか?)に入力することができるかと思います。
|
17
|
+
|
18
|
+
また、質問する際にコードやエラーの部分は、バッククオート(```)を3つつけたもので囲むと良いかと思います。
|