質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

1969閲覧

[python][CSV]スペースを含むカラムのみクォートして書き込みたい

zvub1123

総合スコア230

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2020/07/13 02:22

編集2020/07/13 03:42

python 3.7 を使用して、DBから取得したデータをCSVに書き込んでいく(writer.writerow)処理を実装しています。

出力内容が少々複雑なので、助けていただけると幸いです。

実現したいこと

数字、文字列を各行に含む内容をCSVに出力するのですが、「フィールドに半角スペースが含まれる場合のみ」ダブルクォーテーションで囲んだ以下のような状態で出力したいです。

1234,"test test",3456 <= 1. 半角スペースを含むのでクォート 1235,sample,452 <= 2. quotechar を含まないためクォートなしで出力 7890,5gg6,6789 <= 3. 2.と同様 asge,"rg""hk6", <= 4. quotechar のデフォルト(")に該当するためクォートされる

csvモジュールの writer には delimiter や quotechar があり、それらで出力内容のクォートを制御できるという点に関しては把握していますが、
上記のような出力を実現できる方法はあるでしょうか?

以下、現在の該当部分のソースとなります。

python3

1with open("/tmp/" + file_name, "a", encoding="utf-8") as csv_file: 2 writer = csv.writer(csv_file) 3 # set header 4 writer.writerow(header) 5 ## Get total number of SELECT data 6 with conn.cursor() as cur: 7 for i in range(offset, current_block_fetch, limit): 8 # get records each 1,000 9 cur.execute(query + " LIMIT %s OFFSET %s", [limit, i]) 10 11 # get and shape of all selected data 12 13 for row in cur.fetchall(): 14 writer.writerow(row) 15

その他、必要な情報などあればコメント等いただければ適宜追記致します。

注釈:現在はcsvモジュールでの書き込みとなっておりますが、実現できるのであればcsvモジュールを使用しない方法でも問題ありません。

よろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tiitoi

2020/07/13 03:04

quoting に指定できるのは下記4種類だけなので、「空白を含む場合のみ」というオプションは csv モジュールにはないですね。 https://docs.python.org/ja/3/library/csv.html#csv.QUOTE_ALL どうしてもやりたければ、csv モジュールを使わないで自分で書く必要があると思います。
zvub1123

2020/07/13 03:30

ありがとうございます。やはり作りこむ必要がるようですね。。。
guest

回答1

0

ベストアンサー

df に該当データが入っているとして

Python

1for i in range(len(df.columns)): 2 for j in range(len(df)): 3 val = str(df.iloc[j, i]) 4 if '"' in val: 5 val = '"' + val.replace('"', '""') + '"' 6 df.iloc[j, i] = val 7 if ' ' in val: 8 val = '"' + val + '"' 9 df.iloc[j, i] = val 10df.to_csv('out.csv')

こんな感じでしょうか

投稿2020/07/13 09:39

aokikenichi

総合スコア2218

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

zvub1123

2020/07/14 00:20

ありがとうございます!Pandasを使うとスマートにできそうですね。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問