pythonでもtsvファイルの扱い方

自分が自然言語処理に挑戦したくてもともとあったcsvファイル(5列2000行のDataFram)を必要な2列2000行のデータに変えてそれをあるサイトでtsvファイルに変換しました。
もともとあったデータは,

ID sentence flag ,,,,,,,
0 aaa 1 ,,,,,,,
1 bbb 2 ,,,,,,,
2 ccc 2 ,,,,,,,
3 ddd 1 ,,,,,,,
4 eee 3 ,,,,,,,
5 fff 2 ,,,,,,,

のようなcsvファイルでした。これを,

aaa 1
bbb 2
ccc 2
ddd 1
eee 3
ddd 2

のようなtsvファイル(sentenceとflagの間は半角スペース)にしたかったのですが,df.loc[[:,['sentence','flag']]で必要なカラムだけ取り出して、df.to_csvでcsvファイルを出力してtsvファイルにして,data = pd.read_csv("data.csv")でdataを出力したところ、

\tsentence\tflag
0\taaa\t1
1\tbbb\t2
2\tccc\t2
3\tddd\t1
4\teee\t3
5\tfff\t2

のように出力されてしまいました。(最初の0,1,2,3...はIDではないです)これを真ん中のデータに変える方法はありますでしょうか？

coco_bauer

2020/08/10 14:13

最初の文章。「もともとあったcsvファイル」、「を改造して」、「tsvファイルに変換した」、「が」、「のような形で出力されました」の意味が判りません。「もともとあったcsvファイル」というのは、どのような内容のファイルですか？「を改造して」とは、具体的に何をしたのかを説明してください。「のような形で出力されました。」というのは、何から、どうやって出力されたのですか？「といった形のtsvファイルにしたい」という　"aaa 1"というのは何を表しているのですか？　３つ連なったaと、半角スペースと、1、ですか？　質問の２行目の”0\taaa\t1”のようにタブを￥t　と表す表記を使わないのは何故ですか？すみませんが、理解可能な日本語にしてください。

meg_

2020/08/10 14:20

> csvファイルを改造して、tsvファイルに変換した変換した方法を掲載してください。

rikubon_

2020/08/10 15:17

コメントありがとうございます。すべて変えてみましたのでもう一度見てもらえないでしょうか？タブに関しては自分からですと￥と出力されているように見えるのですが。。。不備がありましたら、すみません

meg_

2020/08/10 15:44

> sentenceとflagの間は半角スペースそれですとタブ区切りではなくスペース区切りですね。それとは別にtsvファイルをpythonでDataFrameにした方法に問題がありそうですね。DataFrameにしたコードを質問に追記してください。

rikubon_

2020/08/10 15:52

そうなんですね。データフレームは元々あるデータを使ったので他に解決策はありますかね？

行動規範の内容に同意します

回答2件

ベストアンサー

スペースで区切らえた、sentenceとflagだけのcsvファイルが欲しいいんですよね？

text
1\tsentence\tflag
20\taaa\t1
31\tbbb\t2

これは、「tab」区切りで、index付き(このindexは自動で付いたものでしょう)で出力された結果ですので、区切り(separator)をスペースにして、indexを出力しないように指定してto_csvをすればいいと思いますが。

python
1pandas.to_csv(df, sep=" ", index=False)

投稿2020/08/11 00:10

TakaiY

総合スコア13847

tsvファイルのDataFrameへの読み込み方です。　※data.csvはtsvファイルとする

Python
1data = pd.read_csv("data.csv", sep='\t')

投稿2020/08/10 16:02

meg_

総合スコア10762

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

pythonでもtsvファイルの扱い方

関連した質問