🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

2回答

876閲覧

pythonからMecabを用いて形態素解析を行いたいが、品詞が適切に検出されていない

2dashun

総合スコア4

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2021/02/09 09:49

pythonからMecabを用いて形態素解析を行おうとしています。

python

1text = "解析したいテキストを入れる。" 2tagger = MeCab.Tagger('-Ochasen') 3result = tagger.parseToNode(text) 4while result: 5 print('%-10s \t %-s' % (result.surface, result.feature)) 6 result = result.next

上のコードの出力結果は以下の通りです。

BOS/EOS,*,*,*,*,*,*,*,* 解析 名詞,一般,*,*,*,*,* したい 名詞,一般,*,*,*,*,* テキスト 名詞,一般,*,*,*,*,* を 名詞,一般,*,*,*,*,* 入 名詞,一般,*,*,*,*,* れる 名詞,一般,*,*,*,*,* 。 名詞,サ変接続,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,*

上記のように、品詞が全て名詞となってしまいます。

一方で、コマンドプロンプトからMecabを実行して同じ文章を解析した場合、

解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ たい 助動詞,*,*,*,特殊・タイ,基本形,たい,タイ,タイ テキスト 名詞,一般,*,*,*,*,テキスト,テキスト,テキスト を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 入れる 動詞,自立,*,*,一段,基本形,入れる,イレル,イレル

と出力され、適切に品詞を検出しているようです。

初心者のため、この現象がどこに原因があるか見当がついておりません。
心当たりのある方がいらっしゃいましたらアドバイスを頂けますと幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

環境やインストール手順によって様々な原因がありえます。

ざっと考えられるもの。

  • MeCabの文字コードがSHIFT-JIS(参考
  • MeCabとPythonが32bit/64bitで合っていない
  • 使っているバインディングが悪い

投稿2021/02/09 18:37

hayataka2049

総合スコア30935

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

2dashun

2021/02/13 05:58

辞書ファイルのsys.dicを生成時にC:\>mecab-dict-index -d"C:\Program Files\MeCab\dic\ipadic" -f utf8 -t utf8 として作成しています。 mecabは以下のURLよりダウンロードしており、64bitのものです。https://github.com/ikegami-yukino/mecab/releases/tag/v0.996 使っているバインディングに関しては、適切かどうか確認する方法はございますでしょうか??
guest

0

質問文にOSもバージョンも一切書かれていないので勘で答えますが
辞書のインストールとセットアップはされましたか?

投稿2021/02/09 13:05

technocore

総合スコア7337

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

2dashun

2021/02/13 05:00

辞書のインストールは行っています。セットアップとは、具体的にどのような作業を指すのでしょうか? C:\Program Files\MeCab\dic\ipadicの直下にsys.dicファイルはおいてあります。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問