入力された文章を分解してリストにしたい
初心者質問で申し訳ありません。
Python3.7でPyCharmを使いプログラムの勉強をしてる者です。
入力した文章を単語ごとに分けてリストに入れる、という処理を作ろうと思いました。
そこで、色々とウェブサイトを調べていたら、どうやらnode.surfaceで文章の単語を取得できるようだ、と理解したのですが、どうもそのように動作しないのです。
そこで、単にnode.surfaceを変数に格納してその変数をprintで出力してみたところ、単語ではなく文章全体が出てきました。
これは、もともとこういうものなのでしょうか? また、何かやり方を変えればnode.surfaceで単語だけを抽出できるのでしょうか? 誰か、教えていただけると幸いです。
処理結果
おしゃべりください:世界で一番人口の多い国は中国です。 世界で一番人口の多い国は中国です。 世界で一番人口の多い国は中国です。 で一番人口の多い国は中国です。 一番人口の多い国は中国です。 人口の多い国は中国です。 の多い国は中国です。 多い国は中国です。 国は中国です。 は中国です。 中国です。 です。 。
該当のソースコード
import MeCab tagger = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/ipadic') text = input("おしゃべりください:") tagger.parseToNode('') node =tagger.parseToNode(text) while node: word = node.surface print(word) node = node.next
試したこと
色々とウェブサイトを巡りましたが、同じコードを入れてるのに違う結果が出てきた時点でどうしようもなく、質問させていただきました。
補足情報(FW/ツールのバージョンなど)
mecab-python3 0.996.1
mecab-0.996
回答1件
あなたの回答
tips
プレビュー