前提・実現したいこと
自分のプログラムをOpenACCを使って早くしたいのですがg++ -fopenacc ○○.c(cpp)でコンパイルしても全く早くなりません.
また,下に記したライプニッツ法で円周率を求めるサンプルプログラムでも結果は全く変わりませんでした.
本によるとこれくらい早くなるようなので何が悪いのかと考えてます.
PGIコンパイラを使わなければ効果がないのでしょうか?
またubuntuで実行していますが,実行中にwindowsのタスクマネージャーを見てもGPUのパフォーマンスの項目が反応していません.
数字が小さいからかと思って計算量を多くしてみましたが反応がなくLeibniz(n, 0)もLeibniz(n,1)も等しいままでただ処理時間が長くなるだけでした.
またGPUが複数ある場合に実行するGPUを指定するにはどうするのでしょうか?
調べてもそのあたりがはしょられたものしか見つからず完全に手詰まりなのでアドバイスお願いします.
発生している問題・計算結果
GTX1060
1 C: n= 1000000, elapsed time=0.0468750000 [sec], pi=3.14159165358977432447 2OpenACC: n= 1000000, elapsed time=0.0468750000 [sec], pi=3.14159165358977432447 3 C: n= 10000000, elapsed time=0.3593750000 [sec], pi=3.14159255358979150330 4OpenACC: n= 10000000, elapsed time=0.3593750000 [sec], pi=3.14159255358979150330 5 C: n= 100000000, elapsed time=3.5000000000 [sec], pi=3.14159264358932599492 6OpenACC: n= 100000000, elapsed time=3.5156250000 [sec], pi=3.14159264358932599492 7 C: n= 1000000000, elapsed time=34.9375000000 [sec], pi=3.14159265258805042720 8OpenACC: n= 1000000000, elapsed time=35.4843750000 [sec], p
tesla v100 C: n= 1000000, elapsed time=0.0654819980 [sec], pi=3.14159165358977432447 OpenACC: n= 1000000, elapsed time=0.0576860011 [sec], pi=3.14159165358977432447 C: n= 10000000, elapsed time=0.5476359725 [sec], pi=3.14159255358979150330 OpenACC: n= 10000000, elapsed time=0.5475519896 [sec], pi=3.14159255358979150330 C: n= 100000000, elapsed time=5.3251781464 [sec], pi=3.14159264358932599492 OpenACC: n= 100000000, elapsed time=5.3305191994 [sec], pi=3.14159264358932599492 C: n= 1000000000, elapsed time=52.7688751221 [sec], pi=3.14159265258805042720 OpenACC: n= 1000000000, elapsed time=52.7695045471 [sec], pi=3.14159265258805042720
該当のソースコード
c
1// 2// Leibniz pi ,for C, OpenACC 3// 4// (c)Copyright Spacesoft corp., 2018 All rights reserved. 5// Hiro KITAYAMA 6// 7#include <stdio.h> 8#include <math.h> 9#include <time.h> 10 11//---------------------------------------------------------------- 12void Leibniz(const int n, const int acc) 13{ 14 clock_t start = clock(); 15 16 double pi = 0.0f; 17 #pragma acc kernels if(acc) 18 for (int i = 0; i < n; i++) 19 { 20 pi += (double)(pow(-1, i) / (double)(2 * i + 1)); 21 } 22 23 pi *= 4.0f; 24 25 clock_t stop = clock(); 26 27 fprintf(stdout, " n=%11d,", n); 28 fprintf(stdout, " elapsed time=%.10f [sec], pi=%.20f\n", 29 (float)(stop - start) / CLOCKS_PER_SEC, pi); 30} 31 32//---------------------------------------------------------------- 33int main() 34{ 35 for(int n = 1000000; n <= 1000000000; n *= 10) 36 { 37 fprintf(stdout, " C:"); 38 Leibniz(n, 0); 39 fprintf(stdout, "OpenACC:"); 40 Leibniz(n, 1); 41 } 42 43 return 0; 44} 45
補足情報(FW/ツールのバージョンなど)
g++は本日最新にしました.
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/10/24 12:00