質問編集履歴

見づらかったので改行を調整しました

2016/02/24 01:20

投稿

takushi168

スコア228

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -19,18 +19,22 @@
 ①まず全件SELECTして、PHP側でsimilar_text関数やlevenstein関数を使って重みづけ・ソート
  →件数によってはSELECT時にPHPがメモリオーバーを起こす恐れがあるため、
   何らかの条件である程度絞ってSELECTするという妥協もあり
 ②完全一致でSELECT、8文字程度の前方一致でSELECT…と
  少しずつ条件を緩和しつつ何度かSELECTし、10件以上抽出できた時点で終了
  →PHPから何度もSQL実行するのはオーバーヘッドが大きくなるためできれば避けたいが、
   遅い複雑なSQLよりはマシかもしれない…
 ③MySQLのストアドプロシージャでPHPのlevenstein関数のようなものを作る
  →他の方が試していたので実は詳細を把握していないのですが、
   1万件から検索するのに15秒ほどかかっていました。
 ④abcd→「a ab bc cd d」のように分割した文字列を格納するフィールドを別途用意して
  FULLTEXTインデックスを張り、MATCH～AGAINST構文でSELECT
  →インデックスの制約に引っかかってうまく検索できない
   （50％以上のレコードに含まれている単語は無視される）
   MySQLのソースを書き換えれば動くようだが、同じサーバで稼働中のサイトもあり、極力避けたい
 ⑤2文字程度までの不一致は許可するとして、検索する文字列が「abcdefghij」とすると、
  「%cdefghij%」「%a%defgihj%」「%ab%efghij%」…という文字列を生成してLIKE検索する
  →取得した中での重みづけが必要なら考慮する必要がある。また、部分一致でのSELECTだと速度面が不安