質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Ruby on Rails 5

Ruby on Rails 5は、オープンソースのWebアプリケーションフレームワークです。「同じことを繰り返さない」というRailsの基本理念のもと、他のフレームワークより少ないコードで簡単に開発できるよう設計されています。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

解決済

1回答

2714閲覧

ruby on rails 多次元配列の中身の配列をcsvの文字列にする方法

hiepita1

総合スコア37

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Ruby on Rails 5

Ruby on Rails 5は、オープンソースのWebアプリケーションフレームワークです。「同じことを繰り返さない」というRailsの基本理念のもと、他のフレームワークより少ないコードで簡単に開発できるよう設計されています。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

1クリップ

投稿2018/03/26 09:06

お世話になっております。
おそらく物凄く初歩的な質問になってしまうのですが、ご教示頂ければと思います。

以下のような多次元配列があった場合に、中身をcsv文字列にした1次元配列に変換したいです。
単純にeachでぐるぐる回して.to_csvすると、速度面で問題があるので、他になにか早い方法がないかご教示いただきたいです。

//実際にはarrayが何十万行もあるため、グルグル回してto_csvする方法だと速度面で問題があります。 array = [[1,2],[3,4],[5,6],[7,8]] array.each do |item| item = item.to_csv end

よろしくお願い致します。

RubyOnRails5
Ruby2.4

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

gouf

2018/03/26 10:51 編集

その処理として要求されている動作・背景はどのようなものでしょうか? たとえば ActiveJob で遅延処理をして、ユーザが頃合いを見てダウンロード可能になったデータを取得するといったことは可能でしょうか?
hiepita1

2018/03/26 11:14 編集

ご質問ありがとうございます。 だいぶ端折ってしまったのですが、大量データをpostgresqlにインサートすることを最終目標としています。計測したところ、copyコマンドでcsvを流すのが最も速度が早かったので、2次元配列の中身をcsvに変換してcopyコマンドで流そうとしています。しかし、insert部分ではなくcsvに変換する部分がボトルネックになってしまいました。遅延処理等は検討しているのですが、今はとりあえずそもそもの処理を早くすることを目標としています。
guest

回答1

0

ベストアンサー

とりあえずbenchmark-ipsを用いてベンチマーク取ってみました。
追記: to_csvが遅い理由がわかったのでCSV.newを使ってみるものを追加

ruby

1require 'benchmark/ips' 2require 'csv' 3array = Array.new(100_000){|i| [i, rand]} 4 5Benchmark.ips do |x| 6 x.report("to_csv") { array.map{|i| i.to_csv}.join } 7 x.report("join") { array.map{|ary| ary.join ','}.join } 8 x.report("CSV"){ 9 csv = CSV.new "" 10 array.each{|it| csv << it } 11 csv.string 12 } 13 # CSVではないが参考までにMarshal.dump (Rubyのデータ吐き出し系では最速のハズ) 14 x.report("marshal"){ Marshal.dump array } 15 x.compare! 16end

結果は

Calculating ------------------------------------- to_csv 0.218 (± 0.0%) i/s - 2.000 in 9.170508s join 5.510 (± 0.0%) i/s - 28.000 in 5.094200s CSV 2.628 (± 0.0%) i/s - 14.000 in 5.329939s marshal 8.665 (± 0.0%) i/s - 44.000 in 5.081920s Comparison: marshal: 8.7 i/s join: 5.5 i/s - 1.57x slower CSV: 2.6 i/s - 3.30x slower to_csv: 0.2 i/s - 39.68x slower

と、「配列を回す」というよりは「to_csv」が遅い
という結果になりました。


to_csvは1行ごとに

ruby

1(CSV.new("") << row).string

を行うため
複数行を手に入れるために複数回繰り返すのは完全に無駄です。

投稿2018/03/26 12:15

編集2018/03/26 13:05
asm

総合スコア15147

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hiepita1

2018/03/27 05:55 編集

- 細かいベンチーマーク、原因の解明までしてくださってありがとうございます!非常に参考になりました。 - `string.join(',')`にしたところ、処理時間が以前の5分の1になりましたので、こちらを採用したいと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問