質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Elasticsearch

Elasticsearchは、クラウド向けに構築された、RESTful な API を提供する分散型のサーチエンジンアプリケーションです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2425閲覧

【Elasticsearch】pythonで、kuromojiをプラグインしたい

yunyunno

総合スコア16

Elasticsearch

Elasticsearchは、クラウド向けに構築された、RESTful な API を提供する分散型のサーチエンジンアプリケーションです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/01/25 00:26

編集2021/01/28 10:37

〇環境
windows 10
python 3.6.9


〇参考リンク
https://blog.imind.jp/entry/2019/03/08/185935


〇問題

//以下、理解に合わせて修正を加えました。
//読みにくい、理解が間違っているなど指摘がありましたらご連絡ください。

Elasticsearch初心者です。

参考リンクに従い、pythonでの検索機能を実装しました。(下記ソース参照)
こちらにkuromojiをプラグインして、日本語に対応させたいと考えています。

 
ただ、この方法がJavaでのセッティング方法が中心で、pythonでのやり方がわかりません。
Javaのモジュールであることは理解しています。
こちら、どのように対処すればよろしいでしょうか?

インポートの方法、ソースへのプラグイン方法を探しています。
知見をシェアいただけると幸いです。


python

1 2from elasticsearch import Elasticsearch 3 4es = Elasticsearch("http://localhost:9200") 5 6result = es.search( 7 index='test', 8 body={'query': {'match': {'name':text}}}) 9hits = result['hits'] 10first_doc = hits['hits'][0] 11 12print(first_doc["_source"])

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

こちらにkuromojiをプラグインして、日本語に対応させたいと考えています。

Kuromoji は、Java で書かれた形態素解析エンジン(ライブラリ)です。 同じ機能を持つものとして Python でよく使われるのは、MeCab が多いのではないでしょうか。

ただ、この方法がJAVAでのセッティング方法が中心で、pythonでのやり方がわかりません。

なにか勘違いがあるようですが...
Elasticsearch の日本語検索性を上げるのに対応する必要があるのは、Elasticsearch サーバ側です。

JAVA でのセッティングというのがよくわかりませんが、Kuromoji は、サーバ側の日本語処理(形態素解析)のためにサーバ側にセットアップしますので、Elasticsearch サーバ側でのセッティングになります。

質問にある Python コードは、Elasticsearch にコマンドを送信して結果を受け取るだけですので、特に日本語に対して対応する必要は無いと思います。

投稿2021/01/25 01:00

編集2021/01/25 01:01
CHERRY

総合スコア25171

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yunyunno

2021/01/25 04:11 編集

なるほど、、的確な指摘をありがとうございます。 Kuromojiのセットアップを、他の解析器 (MeCabなど) で代用できないことがよく理解できました。 また、kuromojiはソース外でプラグインすることも理解できました。 最後に、pythonでのkuromojiの呼び出し方はご存じでしょうか? ご存じでしたら教えていただきたいです。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問