質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

Q&A

解決済

1回答

2609閲覧

CUDAのダイナミックパラレリズムについて

m_yoko

総合スコア156

C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

0グッド

0クリップ

投稿2018/07/29 11:11

前提・実現したいこと

CUDAのダイナミックパラレリズムを使って、入れ子の関数を作りたいのですが、入れ子先の関数が終了してから入れ子もとに戻るやり方がわかりません。

該当のソースコード

C++

1#include "cuda_runtime.h" 2#include "device_launch_parameters.h" 3#include <stdio.h> 4 5__global__ void kernel2() 6{ 7 printf("kernel2\n"); 8 printf("kernel2\n"); 9 printf("kernel2\n"); 10 printf("kernel2\n"); 11 printf("kernel2\n"); 12 13} 14 15 16__global__ void kernel1() 17{ 18 printf("kernel1\n"); 19 printf("kernel1\n"); 20 printf("kernel1\n"); 21 printf("kernel1\n"); 22 printf("kernel1\n"); 23 kernel2<<<1,1>>>(); 24 __syncthreads(); 25 printf("kernel1\n"); 26 printf("kernel1\n"); 27 printf("kernel1\n"); 28 printf("kernel1\n"); 29 printf("kernel1\n"); 30 31 32} 33 34int main() 35{ 36 kernel1<<<1,1>>>(); 37 return 0; 38}

試したこと

__syncthreads();を入れてみたりしたのですが、うまくいきません。

期待する動作は、

kernel1 Start kernel2 kernel2 kernel2 kernel2 kernel2 kernel1 End

になってほしいのですが、非同期実行のため、

kernel1 Start kernel1 End kernel2 kernel2 kernel2 kernel2 kernel2

になってしまいます。呼び出し元で、関数が完了するまで待つということができればいいのだと思いますが、思い浮かびません。

補足情報(FW/ツールのバージョンなど)

VS2017 CUDA 9.2 GPU:GTX1060

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

__syncthreads() のかわりに cudaDeviceSynchronize() で試してみて。

投稿2018/08/04 22:21

episteme

総合スコア16614

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

episteme

2018/08/05 06:31

おっと、低評価喰らうよなこと書いたかしら。コンパイルして動作確認までやったよー
m_yoko

2018/08/05 13:28

良い感じになりました!ありがとうございます! 低評価は私じゃない別の人が押したみたいですね・・・
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問