回答編集履歴

4

修正

2021/05/01 08:43

投稿

hayataka2049
hayataka2049

スコア30935

test CHANGED
@@ -48,7 +48,7 @@
48
48
 
49
49
 
50
50
 
51
- `numpy.where`はCで実装されており、この場合、ちゃんとCPUがぶん回ります。CPUクロック数が4*10^9くらい、同時実行できる命令が控えめに見て3くらいということで10^10程度の命令実行数が期待でき、1行処理するのに多めに見積もって10^3命令要るとしても1秒で10^7行を処理できます。
51
+ `numpy.where`はCで実装されており、この場合、ちゃんとCPUがぶん回ります。CPUクロック数が4*10^9くらい、同時実行できる命令が控えめに見て3くらいということで10^10/s程度の命令実行数が期待でき、1行処理するのに多めに見積もって10^3命令要るとしても1秒で10^7行を処理できます。
52
52
 
53
53
 
54
54
 

3

追記

2021/05/01 08:43

投稿

hayataka2049
hayataka2049

スコア30935

test CHANGED
@@ -99,3 +99,7 @@
99
99
 
100
100
 
101
101
  実際、許容範囲じゃないの? という時間で動いたことは報告しておきます。
102
+
103
+
104
+
105
+ プロセス並列化をやった場合は、素直にやるとプロセス間で配列本体のコピーが行われ、へたしたらこっちの方が時間を食います。どうしてもマルチコアを生かして並列化をやるなら、`numba`などでスレッド並列化を書く必要があるでしょう。

2

追記

2021/05/01 08:42

投稿

hayataka2049
hayataka2049

スコア30935

test CHANGED
@@ -41,6 +41,14 @@
41
41
 
42
42
 
43
43
  で、このコードには意味はないです。そもそも並列化できていないため。`DM_adress`は`[(array([2]),), (array([2]),), (array([2]),), (array([2]),), (array([2]),)]`なんて値になります。
44
+
45
+
46
+
47
+ あと、10000000行(10^7か)程度であれば、想像より速く動くと思われます。
48
+
49
+
50
+
51
+ `numpy.where`はCで実装されており、この場合、ちゃんとCPUがぶん回ります。CPUクロック数が4*10^9くらい、同時実行できる命令が控えめに見て3くらいということで10^10程度の命令実行数が期待でき、1行処理するのに多めに見積もって10^3命令要るとしても1秒で10^7行を処理できます。
44
52
 
45
53
 
46
54
 
@@ -90,4 +98,4 @@
90
98
 
91
99
 
92
100
 
93
- 許容範囲じゃないの? という時間で動いたことは報告しておきます。
101
+ 実際、許容範囲じゃないの? という時間で動いたことは報告しておきます。

1

追記

2021/05/01 08:41

投稿

hayataka2049
hayataka2049

スコア30935

test CHANGED
@@ -80,6 +80,10 @@
80
80
 
81
81
 
82
82
 
83
+ if __name__ == "__main__":
84
+
85
+ main()
86
+
83
87
 
84
88
 
85
89
  ```