###前提・実現したいこと
MediaWiki APIを使って、Wikipediaの記事を検索しています。
具体的にいうと、音楽の曲のリリース年などの情報を知りたいです。
繰り返し大量の情報を処理したいのではなく、数百件の記事の情報を知りたいです。
なのにWikipediaの検索の精度が低くて困っています…!
###発生している問題・エラーメッセージ
たとえば
「PERFECT HUMAN RADIOFISH」で検索します。
[https://ja.wikipedia.org/w/api.php?format=xml&action=query&list=search&srsearch=PERFECT HUMAN RADIO FISH](https://ja.wikipedia.org/w/api.php?format=xml&action=query&list=search&srsearch=PERFECT HUMAN RADIO FISH)
最初にヒットするのはこれです。これは期待してたのではないです。
https://ja.wikipedia.org/wiki/SUPER_HITS_50
期待していたのはここです(検索結果の2番目に出てきてた)。
https://ja.wikipedia.org/wiki/PERFECT_HUMAN
別のクエリとして、「星野源 恋」で検索すると、ここが最初に出てきます。
https://ja.wikipedia.org/w/api.php?format=xml&action=query&list=search&srsearch=%E6%98%9F%E9%87%8E%E6%BA%90%20%E6%81%8B
最初にヒットするのはこれです。これは期待してたのではないです。
https://ja.wikipedia.org/wiki/%E3%83%95%E3%82%AD%E3%82%A2%E3%83%AC%E3%83%8A%E3%82%B5%E3%82%A4
期待していたのはここです(検索結果の2番目に出てきてた)。
https://ja.wikipedia.org/wiki/%E6%81%8B_(%E6%98%9F%E9%87%8E%E6%BA%90%E3%81%AE%E6%9B%B2)
###その他調べたこと
ウィキペディアで使用している検索エンジンLuceneは日本語の形態素解析に対応していないので、日本語検索の精度があまり高くありません
とあります。
また、
ウィキペディアの検索機能は、サーバへの負荷を軽減するために、一時的に休止している場合もあります。そのようなときは、外部の検索エンジンを使って検索することもできます。GoogleやYahoo! JAPANなどの検索エンジンでは、「項目名 Wikipedia」と入力して検索してみてください。
と書いてあります。
Wikipediaの検索の精度を高めるようなクエリの入れ方などはあるのでしょうか?
それかGoogleなどの検索のAPIを使うほうがいいですか?(制限がきついようで尻込みしています)
よい方法はありますか?
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/12/10 12:39