実行したいこと
input.csvの単語の羅列されたテキストデータdf["tag]から単語を抽出し、one hot 表現で出力させたいです。
例えば
id tag
1 a b c d e f
2 a d e
3 b c f g
: :
から
id tag a b c d e f g
1 a b c d e f 1 1 1 1 1 1 0
2 a d e 1 0 0 1 1 0 0
3 b c f g 0 1 1 0 0 1 1
: :
のように出力させたいです。
python
1import pandas as pd 2df = pd.read_csv("train_data3.csv", encoding="utf_8")
この続きからわかる方いらっしゃいましたら是非ともご教授よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。