フォルダに入ったメール文を読み込む
受付中
回答 1
投稿
- 評価
- クリップ 0
- VIEW 784
前提・実現したいこと
フォルダを指定し、フォルダ内にあるメールファイル(.msg)を読み込む処理についてです。
以前質問させていただいたプログラムでは、絶対パスしか使えないモジュール使用していたので、
また別のやり方でメールファイルを読み込む処理を作ったのですが、
import ExtractMsg
import sys
args = sys.argv
from glob import glob
for filename in glob(r"{}/*.msg".format(args[1])):
msg = ExtractMsg.Message(filename)
msg_message = msg.body
print(msg.body)
こうすることにより指定したパスで実行すれば、フォルダ内のすべてのメールファイルを読み込む
ことができました。しかし、
import ExtractMsg
import sys
args = sys.argv
from glob import glob
for filename in glob(r"{}/*.msg".format(args[1])):
msg = ExtractMsg.Message(filename)
msg_message = msg.body
with open(msg,encoding="utf-8") as s:
for line in s:
if line.startswith("重要"):
print(msg.body)
else:
pass
このように特定の部分のみの出力の処理を加えたところ、
「Traceback (most recent call last):
File "C:\Work\python\g.py", line 9, in <module>
with open(msg,encoding="utf-8") as s:
TypeError: expected str, bytes or os.PathLike object, not Message」
というエラーがでました。
エラー文の意味がよくわからず、困っている状態です。
解決法、ご教授頂ければ幸いです
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.37%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
2018/10/25 11:24 編集
import sys
args = sys.argv
from glob import glob
for filename in glob(r"{}/*.msg".format(args[1])):
msg = ExtractMsg.Message(filename)
msg_message = msg.body
with open(filename,encoding="utf-8") as s:
for line in s:
if line.startswith("重要"):
print(msg.body)
else:
pass
という感じに修正したところ、何のエラーも出ずにだんまりです・・・
pyファイル名は「file.py」です。
msgファイルはローカルディスクの中の「python」の中、
「test」という名前のフォルダの直下にあるので、
コマンドプロンプトでは
C:\python> file.py ./test
といった風に実行しました。
2018/10/25 11:30
コードからは読み取れません
openでなにをしようとしてるんですか?
2018/10/25 11:45
import sys
args = sys.argv
from glob import glob
import sys
args = sys.argv
from glob import glob
for file in glob(args[1] + '/*.txt'):
with open(file,encoding="utf-8") as f:
for line in f:
if line.startswith("重要"):
print(line)
これをmsgファイルでもできるようにしたいと思い今回のプログラムを作った次第です。
なので、openでglobで指定したフォルダからファイルを読み込みたいと思っています。
2018/10/25 12:05
きちんとファイル名が入ってるでしょうか
2018/10/25 12:44
Traceback (most recent call last):
File "C:\python\test.py", line 9, in <module>
for line in s:
File "C:\Work\python\lib\codecs.py", line 321, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 0: invalid continuation byte
とエラーが出てしまいました。
Unicodeはutf-8に指定したつもりでしたが、何が原因なのでしょう
2018/10/25 12:47
そのファイルをテキストエディタで開いてみて確認してみましょう。
2018/10/25 15:09
import ExtractMsg
import sys
args = sys.argv
from glob import glob
for filename in glob(r"{}/*.msg".format(args[1])):
msg = ExtractMsg.Message(filename)
msg_message = msg.body
print(msg.body)
と、ただフォルダの中身をすべて表示させるだけのプログラムだと問題なく動くのですが、
上記の書き方だと以前変わりなくUnicodeDecodeErrorが出てしまいます。
何か違いがあるのでしょうか