編集履歴

回答編集履歴

ぬ

2019/07/27 07:57

投稿

スコア7468

answer CHANGED Viewed

@@ -1,5 +1,3 @@
-//見てないかもしれませんが
 ブラウザを使った検索システムを作っている。
 サーバー側の開発環境は PHP を使用している。
 その中から既存の Python スクリプトを呼んでいる。
@@ -29,4 +27,33 @@
 背景が分からないのでとりあえずこのくらいで。
 自分なら案２をとりますが、開発になれてない場合は…
-がんばってください。
+がんばってください。
+--- 追記 ---
+//了解しました。つまり実験的なものを作っているってことスね。
+データをcsvで保持し、その中から該当するものを抜き出す
+という発想は少量の場合はOKでも大量になると使えないでしょう。
+で、csvはある程度元の形をとどめなくても大丈夫ですかね?
+まず、csvの分割ですがハッシュを利用します。
+図書館方式といってもいいかもしれません。
+分野や作者別に分類し、そのようにcsvを分割します。
+それでもまだ粒度が足りない場合は、さらに発行年代別に分割します。
+一般的にハッシュといった場合、特定の項目の値を計算し
+結果を元に分類する方式を指すことが多いようですがね。
+例えば10で割った余りによって分類するとか。
+次に、シリアライズを考えます。
+csvは(いわゆる)テキストファイルなので読み込みが遅いです。
+Python でも PHP でもいいのですが、配列オブジェクトを
+各言語で理解しやすい形で出力しておき、利用する際は
+それを読み込んで使います。
+あとは、各csvファイルのプロパティ的な情報をペアで生成しておき
+ある程度はcsvを読まなくても対応できるようにしておく
+とかですかね。
+ポリシーとかもあるでしょうから、どこまでやるかは
+自分で決めてください。CODASYL型のDBMSみたいなやつの
+参考書とかあったらいいんでしょうけど、いまだとむりかなあ。