質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
sed

sedとは、POSIX環境のために作られたコマンドラインエディタです。sedは編集スクリプトの指示のもとに複数のファイルを編集し、標準出力にその結果を出力します。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

sh

shは、UNIX系OSのシェル操作の1つであり、最も基本的なシェルのことです。

Q&A

解決済

1回答

7344閲覧

LinuxでCSV出力する際、改行コードを指定した場合の挙動

tammy

総合スコア12

sed

sedとは、POSIX環境のために作られたコマンドラインエディタです。sedは編集スクリプトの指示のもとに複数のファイルを編集し、標準出力にその結果を出力します。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

sh

shは、UNIX系OSのシェル操作の1つであり、最も基本的なシェルのことです。

0グッド

0クリップ

投稿2019/02/25 15:28

DBでSELECTした結果をCSV出力する処理に、値をダブルクォーテーションで括る機能を追加したいです。

その処理にはヘッダーファイルを指定できる機能と改行コードを指定できる機能(CR、LR、CRLF)があります。
ヘッダーファイルを指定した場合にCRかCRLFを指定するとダブルクォーテーションの付く位置がおかしくなってしまいます。
ヘッダーファイルを指定しなかった場合の挙動は問題ないです。

ヘッダーファイルを指定した際のダブルクォーテーションで括る処理は次のような感じにしています。
ヘッダーファイルの内容が一行目に出力されるので、都合上、一行目と二行目以降を分けて処理しています。

sh

1head -n 1 test.csv | tail -n 1 | sed -e 's/^/"/' -e 's/$/"/' -e 's/,/","/g' > out.csv 2tail -n +2 test.csv | sed -e 's/^/"/' -e 's/$/"/' -e 's/,/","/g' >> out.csv

改行コードがLFの際は全く問題ないです。
CRの場合は、一行目の末尾と二行目以降にダブルクォートが付きません。

"aaa","bbb","ccc
ddd,eee,fff

CRLFの場合は、一行目の末尾が改行されてからダブルクォートが付き、二行目以降は、二行目の先頭、最終行の末尾、カンマの両端のみダブルクォートが付きます。

"aaa","bbb","ccc
"
"ddd","eee","fff
ggg","hhh","iii
jjj","kkk","lll"

初心者ながら考えた結果としては、CRがどうにも悪さをしていると考えています。
色々ネットで見てはみましたが解決方法がわからずです。
説明がわかりにくいかとは思いますが、解決策などヒントをいただけないでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

"が付いてないわけじゃないです。sedの後に、|cat -vしてみれば、
"aaa","bbb","ccc^M"となると思います。^Mは、CRの事です。

つまり、CRは改行でなく、最後のデータの一部と見なされます。

改行がCRLFなら、

Bash

1sed -e 's/^/"/' -e $'s/\r$/"\r/' -e 's/,/","/g'

改行がCRなら、一度LFに直すのが確実です。

Bash

1tr '\r' '\n' | sed -e 's/^/"/' -e 's/$/"/' -e 's/,/","/g' | tr '\n' '\r'

投稿2019/02/25 15:51

編集2019/02/26 00:30
otn

総合スコア84533

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tammy

2019/02/26 04:23

早速丁寧にありがとうございます。 おっしゃる通り^Mが入っていました。 お陰で文字コード変換処理をしている部分を見つけられ、LFに一旦直してから処理をすることで問題解決できました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問