自分が自然言語処理に挑戦したくてもともとあったcsvファイル(5列2000行のDataFram)を必要な2列2000行のデータに変えてそれをあるサイトでtsvファイルに変換しました。
もともとあったデータは,
ID sentence flag ,,,,,,,
0 aaa 1 ,,,,,,,
1 bbb 2 ,,,,,,,
2 ccc 2 ,,,,,,,
3 ddd 1 ,,,,,,,
4 eee 3 ,,,,,,,
5 fff 2 ,,,,,,,
のようなcsvファイルでした。これを,
aaa 1
bbb 2
ccc 2
ddd 1
eee 3
ddd 2
のようなtsvファイル(sentenceとflagの間は半角スペース)にしたかったのですが,df.loc[[:,['sentence','flag']]で必要なカラムだけ取り出して、df.to_csvでcsvファイルを出力してtsvファイルにして,data = pd.read_csv("data.csv")でdataを出力したところ、
\tsentence\tflag
0\taaa\t1
1\tbbb\t2
2\tccc\t2
3\tddd\t1
4\teee\t3
5\tfff\t2
のように出力されてしまいました。(最初の0,1,2,3...はIDではないです)これを真ん中のデータに変える方法はありますでしょうか?
回答2件
あなたの回答
tips
プレビュー