質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
メール

メールは、コンピュータネットワークを利用し、 情報等を交換する手段のことです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3220閲覧

Pythonを使って、Thunderbird内のメールを集計したい

ghost238_gen

総合スコア16

メール

メールは、コンピュータネットワークを利用し、 情報等を交換する手段のことです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2021/04/01 09:56

編集2021/04/03 05:15

プログラミング初学者です。
プログラミングの勉強として
タイトル通り、pythonを用いてthunderbird内のメールを集計し
特定のアドレスからのメールを抽出、
その件名や本文などをそれぞれエクセルへ定期的に出力するプログラムを作りたいと思っています。

現状、なんとなく調べて見たところ
・import email、import mailboxを使うとメールを読み込めるらしい
・from openpyxl を使うとエクセルが操作できるらしい
程度のことがやんわり分かっています。

しかしながら、
・読み込んだメールをどう操作すればいいのか
・特定のメールに絞り込むにはどうすれば良いのか
・import email、import mailboxを使って読み込んだメールをどうエクセルに出力したらいいのか、などが分かっていません。

曖昧でも、「どんな勉強をすればいいのか」「どう調べればいいのか」だけでも教えていただけると嬉しいです。
よろしくお願い致します。

# -*- coding: utf-8 -*- # (下記すべてバックグラウンドで動いて欲しい) # メールデータを取得 # (15分おきに取得して動作して欲しい) import os import email import mailbox from email.header import decode_header mail_box = mailbox.mbox("メールボックス") for key in mail_box.keys(): a_msg = mail_box.get(key) from_str = a_msg.get_from() print(from_str) usbj = '' for bstr,enc in decode_header(a_msg['Subject']) : if enc == None: usbj += bstr.decode("ascii", "ignore") else: usbj += bstr.decode(enc, "ignore") print("subject: "+usbj) for aa_msg in a_msg.walk(): if not 'text' in aa_msg.get_content_type(): continue #"text"パートでなかったら次のパートへ if aa_msg.get_content_charset() : a_text = aa_msg.get_payload(decode=True).decode(aa_msg.get_content_charset(), "ignore") else: if "charset=shift_jis" in str(aa_msg.get_payload(decode=True)): #ひとまず シフトJISだけ特別対応。 a_text = aa_msg.get_payload(decode=True).decode("cp932", "ignore") else: print ("** Cannot decode.Cannot specify charset ***"+msg.get("From")) print(a_text) continue # ライブラリの設定 from openpyxl import load_workbook import datetime # エクセルを開く(新規作成ではなく展開) filepath = "エクセル" wb = load_workbook(filename=filepath) ws1 = wb['集計'] #ステップ3|集計範囲の取得 startdate=datetime.datetime(int(ws2['B2'].value) , int(ws2['C2'].value) , int(ws2['D2'].value)) enddate=datetime.datetime(int(ws2['B3'].value) , int(ws2['C3'].value) , int(ws2['D3'].value)) #ステップ4|エクセルの最終行や最終列の取得 lastrow1=ws1.max_row lastrow2=ws1.max_row lastcol2=ws1.max_column # 最終行を検索し、その下に新着を追記(重複しないようにするには) # 最終行を検索し、その下に新着を追記(保存して閉じる) ws1.cell(row=i, column=j).value = counter

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

68user

2021/04/01 10:56

ソース見たらだいたい出来てるじゃんと思うんですけど、何を質問したいんですか? > ・読み込んだメールをどう操作すればいいのか > ・特定のメールに絞り込むにはどうすれば良いのか > ・import email、import mailboxを使って読み込んだメールをどうエクセルに出力したらいいのか ↑これ? get_from() できてるんだからそれが特定のメールアドレスか判定すればいいんでは? > # (下記すべてバックグラウンドで動いて欲しい) > # (15分おきに取得して動作して欲しい) > # 最終行を検索し、その下に新着を追記(重複しないようにするには) > # 最終行を検索し、その下に新着を追記(保存して閉じる) ↑それともこっち?
ghost238_gen

2021/04/02 09:58

ありがとうございます。 両方、というのが正直なところです。 前者は検索して見聞きしたものをコピペで切り貼りしているだけなので、 あんまり理屈や意味が分かっていない部分が多いです。 後者はそれらが解決した上で取組みたいと思っている機能です。
guest

回答1

0

ベストアンサー

いまさらですが回答しておきます。

・読み込んだメールをどう操作すればいいのか

Excel に追記すればよいので、読み込んだメールを操作しなくてよいのでは。

・特定のメールに絞り込むにはどうすれば良いのか

特定のアドレスからのメールを抽出したいのだから、if 文で from_str が特定の
メールアドレスと一致するか判定すればよいのでは。

・import email、import mailboxを使って読み込んだメールをどうエクセルに出力したらいいのか

ご自身で調べられたとおり openpyxl を使います。

(下記すべてバックグラウンドで動いて欲しい)
(15分おきに取得して動作して欲しい)

自動化したいなら Thunderbird を絡めるのはやめて、すべてサーバサイドで動かして .forward や milter などの仕組みでメールが届いたら都度プログラム実行する、がよいのでは。

最終行を検索し、その下に新着を追記(重複しないようにするには)
最終行を検索し、その下に新着を追記(保存して閉じる)

"openpyxl 最終行に追加" などでぐぐれば普通に出てくると思います。

投稿2021/04/15 12:59

68user

総合スコア2005

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問