Elasticsearch 検索結果のゆれに関して

回答率: 85.48%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.48%

トップ Elasticsearchに関する質問

Q&A

0回答

1510閲覧

Elasticsearch 検索結果のゆれに関して

総合スコア94

0グッド

0クリップ

投稿2017/11/18 07:38

編集2017/11/18 09:10

0

0

Elasticsearchとkuromoji_neologd_tokenizerで日本語フリーワード検索を検証しているのですが、
関連性のあるデーターが抽出されてしまい検索結果が想定よりかなり広く抽出されてしまいます。
関連性のあるデータの抽出という素晴らしい機能ですが、本案件ではいささかノイズになってしまってます。

現在のクエリーの例は以下の通りです。

text
1curl -XGET localhost:9200/my_index/my_type/_search?pretty -d '
2{"query":
3	{"bool":
4		{"must": 
5			[
6				{"match": {"description": "新宿駅"}},
7				{"match": {"description": "カフェ"}}
8			]
9		}
10	}
11}
12'

上記の例だと、トークナイズで新宿+駅に分割され、"新宿"or"駅"を含む"カフェ"だとかなり緩い一致となってしまい、テスト工程で困ってます。
そこで質問ですが、検索キーワードのみズバリ検索したい時はどの様にクエリーを記述したら良いでしょうか？

※地域が限定的なポータルサイトの為、内容的にもキーワード的にもかなり似かよったコンテキストなのでスコアリングでの判断も難しそうです。
（実際スコアが高いデータでも新宿じゃないデータが上位に来てしまいます..）
※CGM的な投稿もあるので、入力データを調整して投入する様な運用もほぼNGです。

よろしくお願いします。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Elasticsearchに関する質問

Elasticsearch 検索結果のゆれに関して