質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

Q&A

解決済

1回答

2392閲覧

CUDAのthrustライブラリを使用したプログラムで "trivial_device_copy D->H failed" というエラーが出る

m3Zi8VHu

総合スコア2

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

0グッド

0クリップ

投稿2021/07/11 02:04

編集2021/07/11 02:11

前提・実現したいこと

char型配列A, int型配列Cに対して、以下の条件を満たすchar型配列Bを並列処理で作成したいです。
イメージ説明
しかし、以下のようなエラーが出てしまい、エラーの原因がわからず困っています。
自分なりに調べてみましたが、自分と似たようなケースを見つけることができず、行き詰まっている状態です。
このエラーの原因と対処法を教えてください。
よろしくお願いします。

発生している問題・エラーメッセージ

terminate called after throwing an instance of 'thrust::system::system_error' what(): trivial_device_copy D->H failed: cudaErrorIllegalAddress: an illegal memory access was encountered

該当のソースコード

CUDA

1#include <stdio.h> 2#include <thrust/host_vector.h> 3#include <thrust/device_vector.h> 4#include <cuda.h> 5#include <cuda_runtime.h> 6 7__global__ void test(char *A, char *B, int *C,int n) { 8 int i = blockIdx.x * blockDim.x + threadIdx.x; 9 if (i >= n) return; 10 B[i] = C[i] != 0 ? A[C[i] - 1] : '$'; 11} 12 13int main () { 14 const int n = 12; 15 char A[] = "mississippi$"; 16 thrust::host_vector<char> h_B(n); 17 thrust::device_vector<char> d_B = h_B; 18 int C[] = {11,10,7,4,1,0,9,8,6,3,5,2}; 19 20 dim3 block(8, 1); 21 dim3 grid((n + block.x - 1) / block.x, 1); 22 char *pd_B = thrust::raw_pointer_cast(&d_B[0]); 23 24 test<<< grid, block >>>(A, pd_B, C, n); 25 26 h_B = d_B; // エラー発生個所? 27 28 for (int i = 0; i < n; i++) { 29 printf("%c ", h_B[i]); 30 } 31}

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

C++

1#include <stdio.h> 2#include <thrust/host_vector.h> 3#include <thrust/device_vector.h> 4#include <cuda.h> 5#include <cuda_runtime.h> 6 7__global__ void test(char* A, char* B, int* C, int n) { 8 int i = blockIdx.x * blockDim.x + threadIdx.x; 9 if (i >= n) return; 10 B[i] = C[i] != 0 ? A[C[i] - 1] : '$'; 11} 12 13int main() { 14 const int n = 12; 15 char A[] = "mississippi$"; 16 int C[] = { 11,10,7,4,1,0,9,8,6,3,5,2 }; 17 18 thrust::device_vector<char> d_A(A, A+n); 19 thrust::device_vector<char> d_B(n); 20 thrust::device_vector<int> d_C(C, C+n); 21 22 dim3 block(8, 1); 23 dim3 grid((n + block.x - 1) / block.x, 1); 24 test<<<grid, block >>>( 25 thrust::raw_pointer_cast(&d_A[0]), 26 thrust::raw_pointer_cast(&d_B[0]), 27 thrust::raw_pointer_cast(&d_C[0]), 28 n); 29 30 thrust::host_vector<char> h_B = d_B; 31 32 for (int i = 0; i < n; i++) { 33 printf("%c ", h_B[i]); 34 } 35} 36

投稿2021/07/11 02:45

編集2021/07/11 07:40
episteme

総合スコア16612

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

episteme

2021/07/12 01:37

元コードのどこがマズかったか、わかりました?
m3Zi8VHu

2021/07/17 07:22

回答していただき本当にありがとうございました。また、返信に気づかず返事が遅れてしまい、申し訳ありません。 元コードのエラーの原因はtest()関数に与える引数をすべてデバイス用にキャストしていなかったところであると予想していますが、正しいでしょうか?
episteme

2021/07/17 07:32

キャストもなにも、A,C はデバイス・メモリ上にないのでtestの引数に渡したら失敗するぢゃろ、てことで。
m3Zi8VHu

2021/07/17 07:49 編集

理解できました。ありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問