回答率: 85.35%

質問するログイン新規登録

トップに関する質問 pythonでもtsvファイルの扱い方

編集履歴

質問編集履歴

1

すべて変えました

2020/08/10 15:15

投稿

スコア39

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,25 +1,61 @@
-自分が自然言語処理に挑戦したくてもともとあったcsvファイルを改造して、tsvファイルに変換したんですが、
+自分が自然言語処理に挑戦したくてもともとあったcsvファイル(5列2000行のDataFram)を必要な2列2000行のデータに変えてそれをあるサイトでtsvファイルに変換しました。
-0\taaa\t1
+もともとあったデータは,
-1\tbbb\t1
-2\tccc\t2
-3\tddd\t2　のような形で出力されました。
+ID sentence flag ,,,,,,,
+0  aaa      1    ,,,,,,,
+1  bbb      2    ,,,,,,,
+2  ccc      2    ,,,,,,,
+3  ddd      1    ,,,,,,,
+4  eee      3    ,,,,,,,
+5  fff      2    ,,,,,,,
-自分はこのデータを、
+のようなcsvファイルでした。これを,
 aaa 1
-bbb 1
+bbb 2
 ccc 2
+ddd 1
+eee 3
 ddd 2
+のようなtsvファイル(sentenceとflagの間は半角スペース)にしたかったのですが,df.loc[[:,['sentence','flag']]で必要なカラムだけ取り出して、df.to_csvでcsvファイルを出力してtsvファイルにして,data = pd.read_csv("data.csv")でdataを出力したところ、
+\tsentence\tflag
+0\taaa\t1
+1\tbbb\t2
+2\tccc\t2
+3\tddd\t1
+4\teee\t3
+5\tfff\t2
-といった形のtsvファイルにしたいです。やり方はありますでしょうか？
+のように出力されてしまいました。(最初の0,1,2,3...はIDではないです)これを真ん中のデータに変える方法はありますでしょうか？