質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

Q&A

解決済

1回答

867閲覧

cudaDeviceSynchronize() の代替関数の存在について

jbe00214

総合スコア63

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

0グッド

0クリップ

投稿2022/08/07 06:38

質問事項

cuda 11.6からcudaDeviceSynchronize関数は非推奨になりましたが,ドキュメントを確認しても,代替関数の記載がありません。いずれ代替の関数が提供されるまで,従来の非推奨関数をつかっていくのか,他に代替方法があるのか,その点を教えていただきたく,質問しました。よろしくお願いします。

実現したいこと

複数のblockの処理結果をまとめるスレッドにおいて,同期させる必要があります。
device 上で block の全処理を終了するまで停止させたいといことです。できれば,コンパイラからの警告抑制をせずに,同期処理を行いたいということです。

補足情報(FW/ツールのバージョンなど)

ubuntu 20.04
cuda 11.7

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

kernelを分けて二段階launchするとか、cooperative_groupのGrid Synchronization使うとか。

投稿2022/08/07 09:24

matukeso

総合スコア1590

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbe00214

2022/08/07 11:16 編集

Kernelを分けてやってみました。kernelの間にcudaDeviceSynchronizeを挟んで。すると2倍遅くなりました。GridSynchronizeは使えるか調べてみます。アドバイスありがとうございます。
jbe00214

2022/08/08 05:46

cooperative_group の sync()を使ってみました。おかげさまでうまくいきましたが,<<<,>>>の代わりに,cudaLaunchCooperativeKernelを呼ぶことになり,この関数はHostでしか呼び出せないので,結局はkernelを分けて実行するのと同じという結論になりました。しかし,新たな選択肢を習得できたので感謝しています。ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問