質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
並列処理

複数の計算が同時に実行される手法

Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

5229閲覧

Pythonの並列処理に関して

i.natsuki

総合スコア20

並列処理

複数の計算が同時に実行される手法

Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2016/09/16 09:29

Python初心者の者です。
Pythonで並列処理を実装したく、調べてみるとjoblibという外部モジュールで簡単に書けるということでした。
ひとまずネットの記事を参考にしてコーディングしてみました。

python

1# -*- coding: utf-8 -*- 2from sklearn.externals.joblib import Parallel, delayed 3from time import time 4 5def process(n): 6 return sum([i*n for i in range(10000)]) 7 8start = time() 9 10r = Parallel(n_jobs=-1)( [delayed(process)(i) for i in range(10000)] ) 11print(sum(r)) 12 13print('{0} sec'.format(time() - start))

すると

error

15Process Process-6: 2Traceback (most recent call last): 3 File "C:\Python27\lib\multiprocessing\process.py", line 258, in _bootstrap 4 0Process Process-1: 5Traceback (most recent call last): 6 File "C:\Python27\lib\multiprocessing\process.py", line 258, in _bootstrap 7 self.run() 8 File "C:\Python27\lib\multiprocessing\process.py", line 114, in run 9 self._target(*self._args, **self._kwargs) 10 File "c:\python\test.py", line 6, in f 11 print number, os.getppid(),os.getpid() 12AttributeError: 'module' object has no attribute 'getppid' 13 self.run()

このようなエラーメッセージが延々と出てきてしまいました。

そこで

python

1from sklearn.externals.joblib import Parallel, delayed 2from time import time 3 4try: 5 def process(n): 6 return sum([i*n for i in range(10000)]) 7 8 start = time() 9 10 r = Parallel(n_jobs=-1)( [delayed(process)(i) for i in range(10000)] ) 11 print(sum(r)) 12 13 print('{0} sec'.format(time() - start)) 14except: 15 print('error') 16

このようにtryとexceptを追加して実行してみると

result

1error 2error 3error 4error 52499500025000000 65.7009999752 sec

結果はこのようになりました。
自分はerrorが一つだけ表示されるものだと思っていたのでなぜこのようになったのか教えていただきたいです。
ちなみに五行目の計算結果は正しいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

https://pythonhosted.org/joblib/parallel.html#common-usage
によると、Windows環境では Parallelif __name__ == '__main__': でガードしないと再帰呼び出しされてしまうようです。

以下のようにすることで

Python

1# -*- coding: utf-8 -*- 2from joblib import Parallel, delayed 3from time import time 4 5def process(n): 6 return sum([i*n for i in range(10000)]) 7 8if __name__ == '__main__': 9 start = time() 10 11 r = Parallel(n_jobs=-1)( [delayed(process)(i) for i in range(10000)] ) 12 print(sum(r)) 13 14 print('{0} sec'.format(time() - start))

エラーなく終了しました。

c:\Python27>python "test.py" 2499500025000000 2.89499998093 sec

投稿2016/09/16 16:51

編集2016/09/16 16:53
oblique1121

総合スコア48

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

i.natsuki

2016/09/17 04:12

すごくわかりやすかったです。 丁寧にご説明していただきありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問