前提・実現したいこと
ファイルから文章を読み込んだ後、janomeを用いて形態素解析をする際にその結果が単語ごとでなく1文字ずつになってしまいます。これは正しい動作なのでしょうか。また、単語ごとにする方法はあるのでしょうか。
該当のソースコード
python
1from janome.tokenizer import Tokenizer 2t = Tokenizer() 3 4with open('test.txt', 'r', encoding='utf-8') as f: 5 lines = f.read().split('\n') 6 for s in lines: 7 for w in t.tokenize(s): 8 print(w)
test.txt
私は犬が好き。
実行結果
私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 犬 名詞,一般,*,*,*,*,犬,イヌ,イヌ が 接続詞,*,*,*,*,*,が,ガ,ガ 好 名詞,一般,*,*,*,*,好,ヨシミ,ヨシミ き 助動詞,*,*,*,文語・キ,基本形,き,キ,キ 。 記号,句点,*,*,*,*,。,。,。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。