質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

15450閲覧

csvファイルをみたら一つのセルに改行がされているので1行にしたい。

wawo

総合スコア12

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1グッド

1クリップ

投稿2018/10/24 08:15

編集2018/10/24 08:45

あるcsvファイルから一行ずつ単語を出そうと思ったのですが、
csvファイルのなかで改行がされているせいでおかしなことになっています。

現状のcsvファイル を1行ずつ読み取るとこうなります。

import csv with open("現行.csv") as f: line = f.readline() while (line): print(line) line = f.readline()

'"あ\n'
'"\n'
'"い\n'
'"\n'
'"う\n'
'"\n'

これだと1行ずつ読み取っても単語として認識してもらえず困っています。

理想のcsvファイル
'"あ"'
'"い"'
'"う"'

としたいです。
どうしたら良いでしょうか。

conan_edg👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

showkit

2018/10/24 08:28

「理想のCSVファイル」という言い方をしているのは、現行のCSVファイルを変換したいのですか?前半の文章を読むと現行のファイルのままで読んだ結果が理想の形になるように読みたいようにも思えるのですが・・・。
wawo

2018/10/24 08:32

原稿csvファイルで単語を単語として認識するコードが作れたらそれでも良いのですが、複雑にしたくないので。まず、現行のcsvファイルを理想のcsvファイルにpythonで作り直したいなと思っています。
guest

回答3

0

現行CSVは以下のような形式だと想定した場合の回答です。

PlainText

1"あ\n"\r\n <--これが1行 2"い\n"\r\n 3"う\n"\r\n

Excelなどで複数行を含むセルが存在するCSVを作成するとこのような形になります。

pandasを使ってCSVを読み込み\nを空文字に置換します。

Python

1import pandas as pd 2df = pd.read_csv('test.csv', header=None, encoding='cp932') # とりあえずShift JISと想定 3print(df) 4""" 5 0 60 あ\n 71 い\n 82 う\n 9""" 10 11# \nを空文字に置換 12df = df.replace('(.*)\n',r'\1',regex=True) 13print(df) 14""" 15 0 160 あ 171 い 182 う 19""" 20 21for idx,row in df.iterrows(): 22 print('[{}]'.format(row[0])) 23""" 24[あ] 25[い] 26[う] 27"""

投稿2018/10/24 09:01

編集2018/10/24 09:12
can110

総合スコア38262

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

(1) str.rstrip() 使う

https://docs.python.org/ja/3.7/library/stdtypes.html?highlight=strip#str.rstrip

Python

1with open("test.csv") as f: 2 for line in f: 3 print(line.rstrip())

(2) そのまま標準ライブラリのcsvを使う

Python

1import csv 2with open("test.csv") as f: 3 reader = csv.reader(f) 4 for line in reader: 5 print(line)

投稿2018/10/24 08:58

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

wawo

2018/10/24 10:09

ありがとうございます。そちらはやっていて結局改行されてしまうんです...
guest

0

ベストアンサー

CSVファイルは " (ダブルクォーテーション) があると、次に " が出現するまでの文字列を1つのセルの情報として扱います。
TEXTファイルの1行を読めばCSVの1行が取得できるわけではありませんし、 "" のようにダブルクォーテーションが続くと " を意味するとか、CSVファイルのルールがあります。
それに従ったコードにする必要があります。

言語はわかりませんが、メジャーな言語であればCSV読み込み用のライブラリや実装例もありますし、CSVファイルの仕様を元に自分で作成してもさほど大した処理でもありません。

CSVファイルの仕様はRFC4180で定義されていますのでご確認ください。
http://www.kasai.fm/wiki/rfc4180jp

以下追記

すみません、Pythonと記載がありました。見逃していました。

import csv

を使えば簡単にできませんか?
あとは実際に試したコードを記載していただくと回答が早くつくかもしれません。

以下追記

このコードでいかがですか?
importしたcsvを使いましょう。

python

1import csv 2 3with open("現行.csv") as f: 4 r = csv.reader(f, delimiter=",", doublequote=True, lineterminator="\r\n", quotechar='"', skipinitialspace=True) 5 for row in r: 6 print(row)

投稿2018/10/24 08:36

編集2018/10/24 08:57
moonphase

総合スコア6621

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

wawo

2018/10/24 08:47 編集

コードを追加しました。 新しくcsvファイルを作ろうと思ったら、文字ごとに列が区切られてしまっていることに気づき、 書いたコードで一行ずつ出力したところ改行がいたるところに入っていました。
wawo

2018/10/24 10:11

できました。! 最初に\nが入ってしまうことだけ少し気になりますが、問題はなさそうです。ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問