質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

2回答

1800閲覧

高速にCSVファイルの中身を検索する方法

nagak

総合スコア16

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2021/07/10 12:44

編集2021/07/10 13:27

どうか皆様の知恵をお貸しください。
PHPで容量1GBぐらいの以下のような中身ののCSV1から、CSV2の各数字と一致する行をすべて検索するとします。
超高速に検索するにはどのような方法がありますか?

条件として、データベースを使用しなければ何でもありです。
CSVファイルの前処理やインデックスのようなものを作る、別プログラムを実行させるなどもありです。

また、ラズパイで動作させるためメモリは1GBです。

csv1

18376611070,"2013-01-11 19:49:43",53.656745,-2.083711 28511907498,"2013-02-26 11:34:45",51.48785,-3.276865 38498711517,"2013-02-22 22:54:55",44.038833,-92.486667 4 . 5 . 6 . 7

csv2

18376611070 28511353498 38511534498 456

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

takasima20

2021/07/10 12:47

csv2 はどんくらいあるの?
maisumakun

2021/07/10 12:52

> データベースを使用しなければ何でもありです。 なぜこの制約が必要なのでしょうか?
nagak

2021/07/10 13:21

csv2は500MBぐらいです。 データベースを使用しないのは、課題でデータベースなしという条件で高速に検索できるプログラムを作成しているからです。
Zuishin

2021/07/10 13:51

課題なのに自分で何一つ考えずネットに投げるのか。 何のためにやってるんだろう。 時間の無駄だからやらなくていいんじゃないの?
hentaiman

2021/07/10 23:59

> 条件として、データベースを使用しなければ何でもありです。 > CSVファイルの前処理やインデックスのようなものを作る、別プログラムを実行させるなどもありです。 そう思うならまずは質問者自身が考えたそれらの方法をコードで載せるなりgithubなどに載せて回答する側が実行して試せるものを用意し、何故そのコードになったのか理由も書いてください それより速いものを回答出来る人もいるかもしれないですからね
guest

回答2

0

ベストアンサー

CSV1 を 1行ごとに 1ファイル作成して、ファイル名を第一項目とする。
CSV2 の各行と同じファイル名でアクセス可能となる。
まあ、ファイルシステムの制限でそううまくはいかないと思いますが…

となると、ある程度の規模で分割し、その集団に対してキーからアクセス&調査できる仕掛けを作る。
てのは可能性あるけど、どの程度の集団規模にしてどんな手順でアクセスするかは要検討。

アイデア的にはディレクトリで二分木的なものを構築するのもありかな。
ただ、実際のデータ次第で最適なやり方は変わってくると思います。
(汎用的なものを目指しているんじゃないですよね?)

課題らしいので、どんなんがいいかはご自分でどうぞ。

投稿2021/07/10 13:49

takasima20

総合スコア7464

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

takasima20

2021/07/10 13:51

なんか以前だれかの質問に同じような回答した気がするなあ?
guest

0

1G程度ならメモリ上に全部展開して検索すればいいかと

投稿2021/07/10 12:58

y_waiwai

総合スコア88042

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

nagak

2021/07/10 13:25

すみません、条件には書き忘れていました。 ラズパイで動作させるため、メモリが1GBしかありません。
y_waiwai

2021/07/10 13:27

ならそれを質問文に追記しよう
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問