質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
並列処理

複数の計算が同時に実行される手法

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1923閲覧

Pythonのconcurent.futuresを使って処理を分割しても全体の実行が早くならない

haomoni

総合スコア6

並列処理

複数の計算が同時に実行される手法

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2021/11/20 02:59

Python3.8, CPUは4コア8スレッドです。

「csvファイルを一つ読んで内容を処理し、結果を画像ファイル等に書き出す」という処理を、大量のcsvに対して行っています。
以下のコードような感じです。

python

1import glob 2import pandas as pd 3 4files = glob.glob("./*csv) 5for(file in files): 6 df = pd.read_csv(file) 7 # ファイルごとの処理&書き出し処理をここで行う

処理にかかった時間は以下のようになりました。

# ターミナルのtimeコマンドで計測 real 1m18.548s user 1m17.061s sys 0m1.484s

ファイルの数が膨大なので、並列で処理を行って全体を高速化しようとしました。
以下のようにコードを変更しました。

python

1import concurrent.futures 2 3files = glob.glob("./*csv") 4n = len(files)//4 5files1 = files[0:n] 6files2 = files[n:2*n] 7files3 = files[2*n:3*n] 8files4 = files[3*n:] 9 10def func(files): 11 for(file in files): 12 df = pd.read_csv(file) 13 # ファイルごとの処理&書き出し処理をここで行う 14 15executor = concurrent.futures.ProcessPoolExecutor(max_workers=4) 16executor.submit(func, files1) 17executor.submit(func, files2) 18executor.submit(func, files3) 19executor.submit(func, files4)

これで処理が4倍速になる...と期待しましたが結果は以下のようになりました。

real 0m21.629s user 1m23.304s sys 0m1.683s

処理にかかるuser時間がほぼ同じに(むしろ遅く)なっています。
なぜ全体が速くならないのでしょうか。

自分で調べた範囲では、このページを見る感じマルチプロセスならちゃんと速くなってくれるはずという認識なのですが、誤りがあればご教授いただきたいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2021/11/20 09:35

realが減ってるのだから、高速化できてるのではないですかね
guest

回答1

0

ベストアンサー

並列処理は経過時間を短くできることがありますが、総ユーザ消費時間とシステム消費時間は必ず長くなります。
これは並列処理のオーバーヘッドのためです。

逐次実行時

経過時間 0m21.629s
総ユーザ消費時間 1m17.061s
システム消費時間 0m1.484s

並列実行時

経過時間 0m21.629s
総ユーザ消費時間 1m23.304s
システム消費時間 0m1.683s

経過時間の比率が78.548/21.629 = 3.63160571454991

ということは、4コアで3.63倍ですから並列化の効果はかなり高いほうです。

投稿2021/11/20 06:21

編集2021/11/20 06:24
ppaul

総合スコア24670

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2021/11/20 09:33

逐次実行時の経過時間が違いますよ
haomoni

2021/11/20 09:37

user消費時間の意味を勘違いしていました。 スレッドを同時に動かしている時間はそれらの和になるんですね。(現実の経過時間を単純に指すものだとてっきり...。)
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問