あるWebシステムの検索機能にて、あいまい検索機能があるんですが、
以下のように誤った変換をしてしまうことがあります。
※あいまい検索を使用しているWebシステムは私が開発したものでなく外部委託しているものなのでシステム自体の変更は行えません。
そのため、ログファイルから誤っているワードを抽出する処理を調査しています。
ex.検索ワード:顧客情報を取得する
あいまい検索ワード(正常):顧客 情報 取得
あいまい検索ワード(異常):顧客 情 報 取
現在は、その誤ったワードを、あいまい検索ログ(Excelファイル)から
目視で確認していき、誤りを発見したらそのワードをユーザー登録辞書に登録するという運用を行っています。
しかし、1000件以上のログ情報を目視で見るのは非効率かつ見落とす可能性が高いのでツール化させたいと考えています。
似たようなことをしたことがある方いらっしゃいましたら、ぜひ情報をいただければと存じます。
なお、開発言語はJavaかVBAで開発しようと考えています。(相手がExcelならVBAの方が妥当?)
私の想定では、DBに名詞マスタテーブルを持たせる、または名詞マスタテキスト等を作成しておき、そのマスタ情報とログのあいまい検索ワード欄を照合して、一致していないワードがあれば抽出するという処理で実現できるかと考えていますが、処理時間が非常に時間かかりそうな気がしており、より良い方法がないかなと思っているところです。
有識者の方々、よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。