回答編集履歴

2

refinement

2019/02/13 08:25

投稿

yohhoy
yohhoy

スコア6191

test CHANGED
@@ -26,4 +26,4 @@
26
26
 
27
27
 
28
28
 
29
- 質問文中にあるような演算であれば、A)SIMD化の効果は大きいと思います(がプログラミング難易度はそれなりに高いです)。マルチコア環境であれば B)マルチスレッド化でも高速化が見込めるかもしれません(逆に遅くなってしまうリスクは認識しておいてください)
29
+ 質問文中にあるような演算であれば、A)SIMD化の効果は大きいと思います(がプログラミング難易度はそれなりに高いです)。マルチコア環境であれば B)マルチスレッド化でも高速化が見込めるかもしれません(演算自体がかなり"軽い"部類のため、スレッド並列処理により逆に遅くなってしまうリスクは認識しておいてください)

1

update

2019/02/13 08:24

投稿

yohhoy
yohhoy

スコア6191

test CHANGED
@@ -13,3 +13,17 @@
13
13
 
14
14
 
15
15
  今回のユースケースには適合しないと思いますが、OpenCV 4.0で追加された [Graph API(G-API)](https://docs.opencv.org/4.0.0/d0/d1e/gapi.html) は機能利便性と実行効率改善の両立を狙ったものです。
16
+
17
+
18
+
19
+ ----
20
+
21
+ > 実際のデータが現在200000行1400列となっているためコストを懸念しています。
22
+
23
+
24
+
25
+ 質問中にあるコードよりもさらなる高速化が必須であれば、A) intrinsic関数によるSIMD演算や、B) [`cv::parallel_for_`によるマルチスレッド処理](https://docs.opencv.org/3.4.5/d7/dff/tutorial_how_to_use_OpenCV_parallel_for_.html)も検討してみてください。
26
+
27
+
28
+
29
+ 質問文中にあるような演算であれば、A)SIMD化の効果は大きいと思います(がプログラミング難易度はそれなりに高いです)。マルチコア環境であれば B)マルチスレッド化でも高速化が見込めるかもしれません(逆に遅くなってしまうリスクは認識しておいてください)