????pythonで、one hot 表現にしたものをデータフレームで表示したいです。
分かりにくい質問かもしれませんが、1つの説明変数から複数の説明変数を生成したときに、それらをインプット元のデータフレームに格納する方法が知りたいです。
例えば、一つの説明変数を追加するときなら
python
1import pandas as pd 2df = pd.read_csv("input.csv", encoding="utf_8") 3df['diff_likes_dislikes'] = df['likes'] - df['dislikes']
のようにすればできるかと思わますが、
ここで私が実現したいことは、
1つの説明変数をonehot 表現で複数の説明変数を生成し、説明変数を追加することです。
以下のprintでは、outputまではできるのですが、そこからデータフレームに格納する方法がわかりません。
分かる方いらっしゃいましたら是非ともご教授願います。
python
1df = pd.read_csv("input.csv", encoding="utf_8") 2print(pd.get_dummies(df['categoryId']))
output
1#output 2 1 2 10 15 17 19 20 22 23 24 25 26 27 28 29 30 44 30 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 41 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 52 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 63 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 74 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 85 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 96 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 107 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 118 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 129 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1310 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1411 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1512 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1613 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1714 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1815 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1916 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2017 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 2118 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2219 0 0 0 0 0 0 0 0 0 1 0 23 24以下省略 25```
回答1件
あなたの回答
tips
プレビュー