回答編集履歴
4
修正
test
CHANGED
@@ -48,7 +48,7 @@
|
|
48
48
|
|
49
49
|
|
50
50
|
|
51
|
-
`numpy.where`はCで実装されており、この場合、ちゃんとCPUがぶん回ります。CPUクロック数が4*10^9くらい、同時実行できる命令が控えめに見て3くらいということで10^10程度の命令実行数が期待でき、1行処理するのに多めに見積もって10^3命令要るとしても1秒で10^7行を処理できます。
|
51
|
+
`numpy.where`はCで実装されており、この場合、ちゃんとCPUがぶん回ります。CPUクロック数が4*10^9くらい、同時実行できる命令が控えめに見て3くらいということで10^10/s程度の命令実行数が期待でき、1行処理するのに多めに見積もって10^3命令要るとしても1秒で10^7行を処理できます。
|
52
52
|
|
53
53
|
|
54
54
|
|
3
追記
test
CHANGED
@@ -99,3 +99,7 @@
|
|
99
99
|
|
100
100
|
|
101
101
|
実際、許容範囲じゃないの? という時間で動いたことは報告しておきます。
|
102
|
+
|
103
|
+
|
104
|
+
|
105
|
+
プロセス並列化をやった場合は、素直にやるとプロセス間で配列本体のコピーが行われ、へたしたらこっちの方が時間を食います。どうしてもマルチコアを生かして並列化をやるなら、`numba`などでスレッド並列化を書く必要があるでしょう。
|
2
追記
test
CHANGED
@@ -41,6 +41,14 @@
|
|
41
41
|
|
42
42
|
|
43
43
|
で、このコードには意味はないです。そもそも並列化できていないため。`DM_adress`は`[(array([2]),), (array([2]),), (array([2]),), (array([2]),), (array([2]),)]`なんて値になります。
|
44
|
+
|
45
|
+
|
46
|
+
|
47
|
+
あと、10000000行(10^7か)程度であれば、想像より速く動くと思われます。
|
48
|
+
|
49
|
+
|
50
|
+
|
51
|
+
`numpy.where`はCで実装されており、この場合、ちゃんとCPUがぶん回ります。CPUクロック数が4*10^9くらい、同時実行できる命令が控えめに見て3くらいということで10^10程度の命令実行数が期待でき、1行処理するのに多めに見積もって10^3命令要るとしても1秒で10^7行を処理できます。
|
44
52
|
|
45
53
|
|
46
54
|
|
@@ -90,4 +98,4 @@
|
|
90
98
|
|
91
99
|
|
92
100
|
|
93
|
-
許容範囲じゃないの? という時間で動いたことは報告しておきます。
|
101
|
+
実際、許容範囲じゃないの? という時間で動いたことは報告しておきます。
|
1
追記
test
CHANGED
@@ -80,6 +80,10 @@
|
|
80
80
|
|
81
81
|
|
82
82
|
|
83
|
+
if __name__ == "__main__":
|
84
|
+
|
85
|
+
main()
|
86
|
+
|
83
87
|
|
84
88
|
|
85
89
|
```
|