pythonからMecabを用いて形態素解析を行おうとしています。
python
1text = "解析したいテキストを入れる。" 2tagger = MeCab.Tagger('-Ochasen') 3result = tagger.parseToNode(text) 4while result: 5 print('%-10s \t %-s' % (result.surface, result.feature)) 6 result = result.next
上のコードの出力結果は以下の通りです。
BOS/EOS,*,*,*,*,*,*,*,* 解析 名詞,一般,*,*,*,*,* したい 名詞,一般,*,*,*,*,* テキスト 名詞,一般,*,*,*,*,* を 名詞,一般,*,*,*,*,* 入 名詞,一般,*,*,*,*,* れる 名詞,一般,*,*,*,*,* 。 名詞,サ変接続,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,*
上記のように、品詞が全て名詞となってしまいます。
一方で、コマンドプロンプトからMecabを実行して同じ文章を解析した場合、
解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ たい 助動詞,*,*,*,特殊・タイ,基本形,たい,タイ,タイ テキスト 名詞,一般,*,*,*,*,テキスト,テキスト,テキスト を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 入れる 動詞,自立,*,*,一段,基本形,入れる,イレル,イレル
と出力され、適切に品詞を検出しているようです。
初心者のため、この現象がどこに原因があるか見当がついておりません。
心当たりのある方がいらっしゃいましたらアドバイスを頂けますと幸いです。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/02/13 05:58