前提
下記のサイトを参考にMeCabを使用してテキストファイルを分かち書きし、マルコフ連鎖で文章を生成しようとしています。
テキストファイルには数文字から数十文字程度の短い文章が5万行程入っています。
MeCabで分かち書きすると改行を残したいのに、改行が消えてしまいます。
どのようにすれば改行を残せるのか調べたのですが方法がわかりません。
どのようにすれば改行を残したままにできるのでしょうか?
ご教授いただければ幸いです。宜しくお願い致します。
[文章生成]MeCabをインストールして分かち書きを試してみよう
実現したいこと
- MeCabでテキストファイルを改行を残したまま分かち書きしたい。
発生している問題・エラーメッセージ
- 分かち書きすると改行が消えてしまう。
該当のソースコード
Python
1import MeCab 2import unidic 3import markovify 4 5f = open("テスト.txt", "r", encoding="utf-8") 6s = f.read() # ファイルの内容をすべて文字列に読み込む 7 8print(s) # ファイルの内容を表示する # 改行されている 9 10wakati = MeCab.Tagger ("-Owakati") 11 12result = wakati.parse(s) 13 14print(result) # 改行されていない 15 16# txt_model = markovify.NewlineText(result)
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/08/17 13:22