Pythonのconcurent.futuresを使って処理を分割しても全体の実行が早くならない

Python3.8, CPUは4コア8スレッドです。

「csvファイルを一つ読んで内容を処理し、結果を画像ファイル等に書き出す」という処理を、大量のcsvに対して行っています。
以下のコードような感じです。

python
1import glob
2import pandas as pd
3
4files = glob.glob("./*csv)
5for(file in files):
6    df = pd.read_csv(file)
7    # ファイルごとの処理＆書き出し処理をここで行う

処理にかかった時間は以下のようになりました。

# ターミナルのtimeコマンドで計測
real    1m18.548s
user    1m17.061s
sys     0m1.484s

ファイルの数が膨大なので、並列で処理を行って全体を高速化しようとしました。
以下のようにコードを変更しました。

python
1import concurrent.futures
2
3files = glob.glob("./*csv")
4n = len(files)//4
5files1 = files[0:n]
6files2 = files[n:2*n]
7files3 = files[2*n:3*n]
8files4 = files[3*n:]
9
10def func(files):
11    for(file in files):
12        df = pd.read_csv(file)
13        # ファイルごとの処理＆書き出し処理をここで行う
14
15executor = concurrent.futures.ProcessPoolExecutor(max_workers=4)
16executor.submit(func, files1)
17executor.submit(func, files2)
18executor.submit(func, files3)
19executor.submit(func, files4)

これで処理が4倍速になる...と期待しましたが結果は以下のようになりました。

real    0m21.629s
user    1m23.304s
sys     0m1.683s

処理にかかるuser時間がほぼ同じに（むしろ遅く）なっています。
なぜ全体が速くならないのでしょうか。

自分で調べた範囲では、このページを見る感じマルチプロセスならちゃんと速くなってくれるはずという認識なのですが、誤りがあればご教授いただきたいです。

jbpb0

2021/11/20 09:35

realが減ってるのだから、高速化できてるのではないですかね

行動規範の内容に同意します

回答1件

ベストアンサー

並列処理は経過時間を短くできることがありますが、総ユーザ消費時間とシステム消費時間は必ず長くなります。
これは並列処理のオーバーヘッドのためです。

逐次実行時

経過時間 0m21.629s
総ユーザ消費時間 1m17.061s
システム消費時間 0m1.484s

並列実行時

経過時間 0m21.629s
総ユーザ消費時間 1m23.304s
システム消費時間 0m1.683s

経過時間の比率が78.548/21.629 = 3.63160571454991

ということは、4コアで3.63倍ですから並列化の効果はかなり高いほうです。

投稿2021/11/20 06:21

編集2021/11/20 06:24

ppaul

総合スコア24670

jbpb0

2021/11/20 09:33

逐次実行時の経過時間が違いますよ

haomoni

2021/11/20 09:37

user消費時間の意味を勘違いしていました。スレッドを同時に動かしている時間はそれらの和になるんですね。（現実の経過時間を単純に指すものだとてっきり...。）

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

Pythonのconcurent.futuresを使って処理を分割しても全体の実行が早くならない

関連した質問