前提・実現したいこと
pythonのプログラムで感情分析するohke さんのブログのプログラムを検証してます。
発生している問題・エラーメッセージ
File "C:/Users/momo/Desktop/ニュース感情極性.py", line 25, in <module>
print(texts[0])
IndexError: list index out of range
該当のソースコード
import glob
import re
livedoorトピックニュースの文章リスト
texts = []
livedoorトピックニュースのファイル名一覧を取得する
paths = glob.glob('./text/topic-news/topic-news-*.txt')
for path in paths:
with open(path, 'r') as f:
original_text = f.read()
# 先頭2行は不要なメタ情報のため、削除 text = re.sub(r'^.*\n.*\n', '', original_text) # "【関連"や"■関連"以降は削除 result = re.search(r'(【|■)関連', text) if result is not None: text = text[:result.start()] texts.append(text)
最初の1件を表示
print(texts[0])
試したこと
text/topic-newsホルダの中のtopic-news-*.txtファイルの1ケを残して他は削除。
そして、実行したら、次のエラーメッセジが出た。
UnicodeDecodeError: 'cp932' codec can't decode byte 0x8b in position 103: illegal multibyte sequence
そこで、そのファイルを削除して、新たにメモ帳を開き、削除したファイルの中身をコピーし、貼り付け、ファイルの名前を同じにすれば、成功。(数ファイル作成)
メモリ容量が違って表示される(少し容量が少なくなっているのも(たとえば5KB→4KB)
不思議で理由がわかりません。
補足情報(FW/ツールのバージョンなど)
IDEL(3.5 64bit)を使用して行っています。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/11/13 01:18
2018/11/13 01:25 編集
2018/11/14 11:48
2018/11/14 12:23
2018/11/15 01:03
2018/11/15 01:06
2018/11/15 01:35
2018/11/15 01:55
2018/11/15 01:57