前提・実現したいこと
python環境下におけるmecabで取得したツイートを形態素解析し、出力したい
発生している問題・エラーメッセージ
分かち書きをしたいデータが2MB程度のファイルであれば実行できるのですが、
それ以上のファイルを解析しようとすると
None
となってしまいます。
該当のソースコード
import MeCab import unicodedata wakatilist = [] mecab = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd\n ') f = open('10a_month_analysis_001.txt') line = f.read() line = unicodedata.normalize("NFKC", line)#正規化 line = re.sub(r'[#|#]', " ", line) #line = re.sub(r'[((.*?))]', "", line) line.lower() mecab.parse('') #line = re.sub(r'\n', "", line) sentence = mecab.parse(line) f.close() print(sentence)
補足情報(FW/ツールのバージョンなど)
python 3.6.3
mecab-python3 0.7
を使用しています。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/05/20 10:43