編集履歴

質問編集履歴

ソースを変更しました

2018/09/25 03:14

投稿

スコア77

test CHANGED Viewed

	@@ -1 +1 @@
1	- pythonでgmailを受信する
1	+ python3でgmailを受信&表示する

test CHANGED Viewed

@@ -1,95 +1,165 @@
-[https://qiita.com/hujuu/items/b75f8492000483bc66aa](https://qiita.com/hujuu/items/b75f8492000483bc66aa)
+python3でgmailを読み込み＆表示させるプログラムを作成しましたが、ランダムにエラーが発生します。下記の作成したプログラムを実行すると、実行ごとに異なるメールでエラーが発生＆終了します。
-を参考に、pythonでgmailを取得するプログラムを作成しましたが、
-subject = str(msg_subject.decode(msg_encoding))
-UnicodeEncodeError: 'ascii' codec can't encode characters in position 13-18: ordinal not in range(128)
+４回実行した際のエラーメッセージは以下の通りです。理解できないのは、ある時は６４番めのメールまで問題無く処理されたのに、ある時には、１２番めのメールでエラーとなったり、と毎回pythonの判定が異なる点です。ネット上で問題なく動作した、とされているプログラムを参考に、それを実施に表示する形式に変更したところ、この様な問題が出ました。どなたか、原因が分かる形がいらしたら教えて下さい。
-というエラーが出てしまいます。習うより慣れろでpythonを始めているので、日本語表示の問題はまだ理解できていません。
-どの様にすれば、subjectと本文をうまくデコードして表示出来るでしょうか。
-以下がソースです。
-```ここに言語を入力
+カウント= 53
+Traceback (most recent call last):
+  File "gmail_rx_python_rev3.py", line 31, in <module>
+    msg = email.message_from_string(raw_email.decode(msg_encoding))
+UnicodeDecodeError: 'iso2022_jp' codec can't decode bytes in position 1561-1562: illegal multibyte sequence
+カウント= 64
+Traceback (most recent call last):
+  File "gmail_rx_python_rev3.py", line 31, in <module>
+    msg = email.message_from_string(raw_email.decode(msg_encoding))
+UnicodeDecodeError: 'iso2022_jp' codec can't decode bytes in position 5473-5475: illegal multibyte sequence
+カウント= 15
+XXX <no-reply@XXX.YYY>
+XXX
+Traceback (most recent call last):
+  File "gmail_rx_python_rev3.py", line 50, in <module>
+    title += sub[0].decode(msg_encoding)
+UnicodeDecodeError: 'iso2022_jp' codec can't decode byte 0xe3 in position 0: illegal multibyte sequence
+カウント= 12
+=?UTF-8?B?11Gv11GE11OB11O824K888yB?=<info@XXX.ZZZ>
+Traceback (most recent call last):
+  File "gmail_rx_python_rev3.py", line 50, in <module>
+    title += sub[0].decode(msg_encoding)
+UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 34: invalid start byte
+```python
-  # -*- coding: utf-8 -*-
+ import imaplib, re, email, six
-  import imaplib
-  import email
-  import email.Header
+ e_mail_default_encoding = 'iso-2022-jp'
+ UserName = "XXX@gmail.com"
-  UserName=“xxxx@gmail.com"
+ PassWord = "mypassword"
-  PassName=“MyPassWord”
- gmail = imaplib.IMAP4_SSL("imap.gmail.com",'993')
+gmail = imaplib.IMAP4_SSL("imap.gmail.com",'993')
- gmail.login(UserName, PassName)
+gmail.login(UserName,PassWord)
- gmail.select("INBOX")
+gmail.select("INBOX")
- head, data = gmail.search(None,'UNSEEN')
+type, [data] = gmail.search(None,'UNSEEN')
- for num in data[0].split():
-     h, d = gmail.fetch(num, '(RFC822)')
-     raw_email = d[0][1]
-     #文字コード取得
-     msg = email.message_from_string(raw_email.decode('utf-8'))
-     msg_encoding = email.Header.decode_header(msg.get('Subject'))[0][1] or 'iso-2022-jp'
-     #タイトルの情報を抽出
-     msg_subject = email.Header.decode_header(msg.get('Subject'))[0][0]
-     #エンコーディング
+count = 1
-     subject = str(msg_subject.decode(msg_encoding))
+for num in data.split():
-     print(subject)
+    print("カウント=",count)
+    count+=1
+    result, d = gmail.fetch(num,"(RFC822)")
+    raw_email = d[0][1]
+    #文字コード取得
+    msg = email.message_from_string(raw_email.decode('utf-8'))
+    msg_encoding = email.header.decode_header(msg.get('Subject'))[0][1] or 'iso-2022-jp'
-     #本文の抽出
+    #パースして解析準備
-     body = msg.get_payload()
+    msg = email.message_from_string(raw_email.decode(msg_encoding))
-     print(body)
- #終了処理
- gmail.close()
+#差出人情報を取得
+    fromObj = email.header.decode_header(msg.get('From'))
+    addr = ""
+    for f in fromObj:
+        if isinstance(f[0],bytes):
+            addr += f[0].decode(msg_encoding)
+        else:
+            addr += f[0]
- gmail.logout()
+        print(addr)
+#件名の取得＆表示
+    subject = email.header.decode_header(msg.get('Subject'))
- print("メール読み込み終了")
+    title = ""
+    for sub in subject:
+        if isinstance(sub[0],bytes):
+            title += sub[0].decode(msg_encoding)
+        else:
+            title += sub[0]
+        print(title)
 ```