質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

解決済

2回答

1568閲覧

Ruby csvファイルへの書き込みにおける、クォートの扱いかたについて

退会済みユーザー

退会済みユーザー

総合スコア0

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

0クリップ

投稿2021/04/05 08:45

編集2021/04/05 09:11

CSV classにおける文字列中のクォーテーションやカンマの扱いがわかりません

rubyにてテキストファイルを読み込み、csvファイルへ書き出そうとしています。
文字列中に/,/と/"/が含まれています。

数値はダブルクオートで囲いたいです。
一方で、pau",lはそのままの文字列として出力したいです。

該当のソースコード

meibo2.txt

1john m 18 2pau",l m 20 3alice f 15 4dabid m 17 5jasmin f 17

ruby

1require 'csv' 2 3CSV.open("meibo2.csv", "w") do |person| 4 CSV.foreach("meibo2.txt", col_sep: "\t", quote_char: '"', liberal_parsing: true) do |profile| 5 p profile 6 person << profile 7 end 8 p person 9end 10

これの出力結果が以下です。

["john", "m", "18"] ["pau\",l", "m", "20"] ["alice", "f", "15"] ["dabid", "m", "17"] ["jasmin", "f", "17"] <#CSV io_type:File io_path:"meibo2.csv" encoding:UTF-8 lineno:5 col_sep:"," row_sep:"\n" quote_char:"\"">

###期待するcsvファイルの中身
john,m,"18"
pau",l,m,"20"
alice,f,"15"
dabid,m,"17"
jasmin,f,"17"

###実際のcsvファイルの中身
john,m,18
"pau"",l",m,20
alice,f,15
dabid,m,17
jasmin,f,17

試したこと

CSV.foreach("meibo2.txt", col_sep: "\t", quote_char: '"', liberal_parsing: true) do |profile|

:quote_char: '"'
を追加しましたが、うまくできませんでした。

補足情報(FW/ツールのバージョンなど)

ruby 2.7.2

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mather

2021/04/05 08:56

元の meibo2.txt の内容も記載しましょう。 また、「加工」とはどういう意味なのか記載しましょう。
退会済みユーザー

退会済みユーザー

2021/04/05 09:04

申し訳ございません。meibo2.txtを載せ忘れました。 修正いたします。
guest

回答2

0

ベストアンサー

期待しているCSVファイルの内容がそもそもおかしいです。

text

1john,m,"18" 2pau",l,m,"20" 3alice,f,"15" 4dabid,m,"17" 5jasmin,f,"17"

pau",l はイレギュラーなダブルクオートが発生しているため正しくなく、ダブルクオートをエスケープするために二重にして "pau"",l" となるのがCSV上は正しいのです。

また、数値がダブルクオートで囲まれていない件ですが、そもそもCSV形式上はすべてのカラムは文字列として扱われるため、数値のみ特別にダブルクオートで囲むことはありません。

投稿2021/04/05 08:54

mather

総合スコア6753

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mather

2021/04/05 09:23

参考資料です。 http://www.kasai.fm/wiki/rfc4180jp > 6. 改行(CRLF)、ダブルクォーテーション、カンマを含むフィールドは、ダブルクォーテーションで囲むべきである。 > 7. フィールドがダブルクォーテーションで囲まれている場合、フィールドの値に含まれるダブルクォーテーションは、その直前にひとつダブルクォーテーションを付加して、エスケープしなければならない。
退会済みユーザー

退会済みユーザー

2021/04/05 09:23

>pau",l はイレギュラーなダブルクオートが発生しているため正しくなく、ダブルクオートをエスケープするために二重にして "pau"",l" となるのがCSV上は正しいのです。 その知識が抜けていたため、間違った出力と考えてしまいました。ありがとうございます。 >また、数値がダブルクオートで囲まれていない件ですが、そもそもCSV形式上はすべてのカラムは文字列として扱われるため、数値のみ特別にダブルクオートで囲むことはありません。 CSVファイルを表計算ソフトで開いた時に、数値がダブルクオートで囲まれているかどうかは関係ないということで、理解は正しいでしょうか? また、今回では数値をダブルクオートで囲んだ状態で書き込みたいのですが、その場合はどうすれば良いのでしょうか?
mather

2021/04/05 09:29

「数値のみダブルクオートで囲む」ということは基本的にできません。ダブルクオートで囲んでも囲まなくてもCSVファイル上は全く同じ扱いになります。 どうしても囲みたい場合は force_quotes オプションなどを使うと良いでしょう。詳しくは公式リファレンスなどを確認してください。 https://docs.ruby-lang.org/ja/latest/class/CSV.html#S_NEW
mather

2021/04/05 09:31

「CSVライブラリを使う場合は基本的にできません。」でした。 自前で puts などを使って実装すれば可能ですが、CSV形式として異常な状態のファイルを生成する可能性もあるため、自己責任でお願いします。
退会済みユーザー

退会済みユーザー

2021/04/05 09:33

承知しました。丁寧にありがとうございました。
guest

0

回答されているとおり、CSVとして不正な形式を希望しているので、CSVライブラリは使えません。
入力はタブ区切りですよね?

Ruby

1open("~~~~","w") do |person| 2 IO.foreach("~~~~") do |line| 3 person << "%s,%s,\"%s\"\n" % line.chomp.split("\t") 4 end 5end

文字列の%演算子はご存じでなければ調べてください。

投稿2021/04/05 09:47

otn

総合スコア84798

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/04/05 15:12

ありがとうございます。私のCSVに対する知識が不足していたため、気づけませんでした。 >文字列の%演算子はご存じでなければ調べてください。 使い方を忘れていたので、調べました。本当にありがとうございます。 https://docs.ruby-lang.org/ja/2.7.0/class/String.html#I_--25
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問