私は今、elasticsearchとWebアプリケーションを使って、日本語の全文検索システムを作っています。
そこで入力された単語の類義語も文章から検索できるようにしたいと思いました。
そこでWordnetをElasticSearchと連携させて、類義語検索を実装するのが良い方法だと考えました。
しかしこの連携をさせる良い方法が思いつきません。
私が調べた限りだと
http://javaaswin.blogspot.jp/2014/02/elasticsearch-with-wordnet.html
このリンクのように、"wn_s.pl"ファイルを使えば出来るようです。
しかしこの方法は英語だけだと思います。
また、日本語wordnetはsqliteのデータしか無いように思えます
http://compling.hss.ntu.edu.sg/wnja/index.en.html
このことから私が考える類義語検索システムの手順は以下のようになりました。
1.検索ワードでsqliteにselectをかける。単語が複数返ってくる。
2.その単語を一個ずつ、elasticsearchに検索をかける。
ただこの方法だとElasticSearchに対する検索回数がとても多く、負荷が気になります。
何が良い方法はないでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。