質問編集履歴

修正

2018/10/13 10:43

投稿

run919

スコア10

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -8,37 +8,37 @@
 正直自分ではもうどこが間違っているのかわからないので、質問させていただきました。おそらく吸収境界条件が間違っていると考えているのですが。
-動画ではなく、画像ですがいくつか掲載させていただきます。
+動画ではなく、画像ですがいくつか掲載させていただきます。（プログラムのdt(電界計算＋磁界計算時間)は2e-12s）
 ![イメージ説明](e0c0a20383d6d370001f9ee6503fc858.png)
-___________________t=0.8e-10
+___________________t=0.8e-10s
 ![イメージ説明](bf2159a8b51925dd33e40f653807cb0e.png)
-___________________t=3.0e-10
+___________________t=3.0e-10s
 ![イメージ説明](6836de43f553d502af21a0a3bed463fe.png)
-___________________t=3.2e-10
+___________________t=3.2e-10s
 ![イメージ説明](f49684796ca03254e31c60fd35431082.png)
-___________________t=3.4e-10
+___________________t=3.4e-10s
 ![イメージ説明](8f16568e5febefb0e804373a0c053d88.png)
-___________________t=3.6e-10
+___________________t=3.6e-10s
 ![![イメージ説明](39626614c97a340b141a73a6d7a5f326.png)
-___________________t=4.0e-10
+___________________t=4.0e-10s
 ![イメージ説明](456b82fd27bbbd8f0ddac594c1b2004c.png)
-___________________t=2.0e-9
+___________________t=2.0e-9s

画像追加

2018/10/13 10:43

投稿

run919

スコア10

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -32,10 +32,16 @@
 ___________________t=3.6e-10
-![![イメージ説明](39626614c97a340b141a73a6d7a5f326.png)](ca236bbb256437b08d877e028fca9a4f.png)
+![![イメージ説明](39626614c97a340b141a73a6d7a5f326.png)
 ___________________t=4.0e-10
+![イメージ説明](456b82fd27bbbd8f0ddac594c1b2004c.png)
+___________________t=2.0e-9
 ### 該当のソースコード
 ```

修正

2018/10/13 10:40

投稿

run919

スコア10

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -22,19 +22,19 @@
 ![イメージ説明](6836de43f553d502af21a0a3bed463fe.png)
-___________________t=3.2e-11
+___________________t=3.2e-10
 ![イメージ説明](f49684796ca03254e31c60fd35431082.png)
-___________________t=3.4e-11
+___________________t=3.4e-10
 ![イメージ説明](8f16568e5febefb0e804373a0c053d88.png)
-___________________t=3.6e-11
+___________________t=3.6e-10
 ![![イメージ説明](39626614c97a340b141a73a6d7a5f326.png)](ca236bbb256437b08d877e028fca9a4f.png)
-___________________t=40e-11
+___________________t=4.0e-10
 ### 該当のソースコード

画像の追加

2018/10/13 10:37

投稿

run919

スコア10

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -8,9 +8,33 @@
 正直自分ではもうどこが間違っているのかわからないので、質問させていただきました。おそらく吸収境界条件が間違っていると考えているのですが。
+動画ではなく、画像ですがいくつか掲載させていただきます。
+![イメージ説明](e0c0a20383d6d370001f9ee6503fc858.png)
+___________________t=0.8e-10
+![イメージ説明](bf2159a8b51925dd33e40f653807cb0e.png)
+___________________t=3.0e-10
+![イメージ説明](6836de43f553d502af21a0a3bed463fe.png)
+___________________t=3.2e-11
+![イメージ説明](f49684796ca03254e31c60fd35431082.png)
+___________________t=3.4e-11
+![イメージ説明](8f16568e5febefb0e804373a0c053d88.png)
+___________________t=3.6e-11
+![![イメージ説明](39626614c97a340b141a73a6d7a5f326.png)](ca236bbb256437b08d877e028fca9a4f.png)
+___________________t=40e-11
 ### 該当のソースコード

修正

2018/10/13 10:36

投稿

run919

スコア10

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -2,434 +2,424 @@
-ここに質問の内容を詳しく書いてください。
 NVIDIA社のcudaをvisualsudio2015用いて3次元FDTD法を練習しています。今回、サイズ41×41×41の立方体中のx=20,y=20の位置における0<z<41のEzに電圧を常時印加した場合に、z=20におけるxy平面のEzの値を見ているのですが、普通にCでこのプログラムを作った場合はきれいに最後まで円形の画像が出力され続けるのですが、cudaでは出力画像でx=0とy=0付近においてmurの1次吸収境界条件の効きが悪く、それが原因で発散しているような状況となっています。（吸収境界条件を入れずに完全導体で囲んだ場合はきれいに反射された画像が続く）
 正直自分ではもうどこが間違っているのかわからないので、質問させていただきました。おそらく吸収境界条件が間違っていると考えているのですが。
-■■な機能を実装中に以下のエラーメッセージが発生しました。
-### 発生している問題・エラーメッセージ
+### 該当のソースコード
 ```
-エラーメッセージ
+/*--------------------------------------------メイン計算部分------------------------------------------------------------*/
+while (t[0]<2e-9) {
+		culcEx << <grid, block >> > (Ex_d, oldEx_d, oldHy_d, oldHz_d, A_d, d_d);
+		culcEy << <grid, block >> > (Ey_d, oldEy_d, oldHx_d, oldHz_d, A_d, d_d);
+		culcEz << <grid, block >> > (Ez_d, oldEz_d, oldHx_d, oldHy_d, A_d, d_d);
+		cudaDeviceSynchronize();
+		vin[0] = 1.0*sin(2.0e10*M_PI*t[0]);
+		cudaMemcpy(vin_d, vin, sizeof(double), cudaMemcpyHostToDevice);
+		Init << <grid, block >> > ( Ez_d, t_d, vin_d);
+		cudaDeviceSynchronize();
+		Init2 << <grid, block >> > (Ex_d, Ey_d, Ez_d);
+		cudaDeviceSynchronize();
+MurEx << <grid, block >> > (Ex_d, oldEx_d, A_d);
+		MurEy << <grid, block >> > (Ey_d, oldEy_d, A_d);
+		MurEz << <grid, block >> > (Ez_d, oldEz_d, A_d);
+		cudaDeviceSynchronize();
+		culct << <2,2 >> > (t_d);
+		t[0] += (dt / 2);
+		cudaDeviceSynchronize();
+		culcHx << <grid, block >> > (Ey_d, Ez_d, Hx_d, oldHx_d, A_d, d_d);
+		culcHy << <grid, block >> > (Ex_d, Ez_d, Hy_d, oldHy_d, A_d, d_d);
+		culcHz << <grid, block >> > (Ex_d, Ey_d, Hz_d, oldHz_d, A_d, d_d);
+		cudaDeviceSynchronize();
+		change << <grid, block >> > (Ex_d, Ey_d, Ez_d, oldEx_d, oldEy_d, oldEz_d, Hx_d, Hy_d, Hz_d, oldHx_d, oldHy_d, oldHz_d);
+		cudaDeviceSynchronize();
+		culct << <2, 2 >> > (t_d);
+		t[0] += (dt / 2);
+		cudaDeviceSynchronize();
+		output << <grid, block >> > (out_d, Ez_d);
+		cudaDeviceSynchronize();
+	}
+/*---------------------------------------------------------------------------------------------------------------------*/
+/*------------------吸収境界条件部分----------------------------*/
+__global__ void MurEx(double *Ex, double *oldEx, double *A){
+	int i = blockIdx.x*blockDim.x + threadIdx.x;
+	int j = blockIdx.y*blockDim.y + threadIdx.y;
+	int k = blockIdx.z*blockDim.z + threadIdx.z;
+	if (i < nx && j < ny && k < nz) {
+		Ex[(k * ny * nx + j * nx + 0)] =
+oldEx[(k * ny * nx + j * nx + 1)] + A[3] * (Ex[(k * ny * nx + j * nx + 1)] - oldEx[(k * ny * nx + j * nx + 0)]);
+		Ex[(k * ny * nx + j * nx + nx - 1)] = oldEx[(k * ny * nx + j * nx + nx - 2)] + A[3] * (Ex[(k * ny * nx + j * nx + nx - 2)] - oldEx[(k * ny * nx + j * nx + nx - 1)]);
+	}
+	__syncthreads();
+}
+__global__ void MurEy( double *Ey,  double *oldEy,  double *A){
+	int i = blockIdx.x*blockDim.x + threadIdx.x;
+	int j = blockIdx.y*blockDim.y + threadIdx.y;
+	int k = blockIdx.z*blockDim.z + threadIdx.z;
+	if (i < nx && j < ny && k < nz) {
+		Ey[(k * ny * nx + 0 * nx + i)] =
+oldEy[(k * ny * nx + 1 * nx + i)] + A[3] * (Ey[(k * ny * nx + 1 * nx + i)] - oldEy[(k * ny * nx + 0 * nx + i)]);
+		Ey[(k * ny * nx + (ny - 1) * nx + i)] =
+oldEy[(k * ny * nx + (ny - 2) * nx + i)] + A[3] * (Ey[(k * ny * nx + (ny - 2) * nx + i)] - oldEy[(k * ny * nx + (ny - 1) * nx + i)]);
+	}
+	__syncthreads();
+}
+__global__ void MurEz( double *Ez,  double *oldEz, double *A){
+	int i = blockIdx.x*blockDim.x + threadIdx.x;
+	int j = blockIdx.y*blockDim.y + threadIdx.y;
+	int k = blockIdx.z*blockDim.z + threadIdx.z;
+	if (i < nx && j < ny && k < nz) {
+		Ez[(k * ny * nx + j * nx + 0)] =
+ oldEz[(k * ny * nx + j * nx + 1)] + A[3] * (Ez[(k * ny * nx + j * nx + 1)] - oldEz[(k * ny * nx + j * nx + 0)]);
+		Ez[(k * ny * nx + j * nx + nx - 1)] =
+oldEz[(k * ny * nx + j * nx + nx - 2)] + A[3] * (Ez[(k * ny * nx + j * nx + nx - 2)] - oldEz[(k * ny * nx + j * nx + nx - 1)]);
+		Ez[(k * ny * nx + 0 * nx + i)] =
+oldEz[(k * ny * nx + 1 * nx + i)] + A[3] * (Ez[(k * ny * nx + 1 * nx + i)] - oldEz[(k * ny * nx + 0 * nx + i)]);
+		Ez[(k * ny * nx + (ny - 1) * nx + i)]
+= oldEz[(k * ny * nx + (ny - 2) * nx + i)] + A[3] * (Ez[(k * ny * nx + (ny - 2) * nx + i)] - oldEz[(k * ny * nx + (ny - 1) * nx + i)]);
+	}
+	__syncthreads();
+}
+/*------------------------------------------------------------------------------*/
+//その他補足（プログラムより抜粋)
+♯define nx 41
+♯define ny 41
+♯define nz 41
+dim3 grid;
+	grid.x = 3;
+	grid.y = 3;
+	grid.z = 24;
+	dim3 block;
+	block.x = 16;
+	block.y = 16;
+	block.z = 2;
+/*--------------------------電磁界計算用係数設定------------------------*/
+	A[0] = ((1 - (sig*dt) / (2 * ep)) / (1 + (sig*dt) / (2 * ep)));
+	A[1] = (dt / ep) / (1 + (sig*dt / (2 * ep)));
+	A[2] = dt / mu;
+	A[3] = (c*dt - dx) / (c*dt + dx);
+	/*-----------------------------------------------
+	0:電界計算,1:電界計算,2:磁界計算,3:Mur吸収境界条件
+	-------------------------------------------------*/
+	d[0] = 2.0e-12;
+	d[1] = 1.5e-3;
+	d[2] = 1.5e-3;
+	d[3] = 1.5e-3;
+	/*-----------------------------------------------
+	0:dt,1:dx,2:dy,3:dz
+	-------------------------------------------------*/
+/*----------------------------電界計算----------------------*/
+__global__ void culcEx(double *Ex, double *oldEx, double *oldHy, double *oldHz, double *A, double *d)
+{
+	int i = blockIdx.x*blockDim.x + threadIdx.x;
+	int j = blockIdx.y*blockDim.y + threadIdx.y+1;
+	int k = blockIdx.z*blockDim.z + threadIdx.z+1;
+	if ((0 < j) && (0 < k) && (i < nx) && (j < ny) && (k < nz)) {
+		Ex[(k * ny * nx + j * nx + i)] = A[0] * oldEx[(k * ny * nx + j * nx + i)] + A[1] * (((oldHz[(k * ny * nx + j * nx + i)] - oldHz[(k * ny * nx + (j - 1) * nx + i)]) / d[2]) - ((oldHy[(k * ny * nx + j * nx + i)] - oldHy[((k - 1) * ny * nx + j * nx + i)]) / d[3])); //4
+	}
+	__syncthreads();
+}
+__global__ void culcEy(double *Ey, double *oldEy, double *oldHx, double *oldHz, double *A, double *d)
+{
+	int i = blockIdx.x*blockDim.x + threadIdx.x+1;
+	int j = blockIdx.y*blockDim.y + threadIdx.y;
+	int k = blockIdx.z*blockDim.z + threadIdx.z+1;
+	if ((0<i) && (0<k) && (i < nx) && (j < ny) && (k < nz)) {
+		Ey[(k * ny * nx + j * nx + i)] = A[0] * oldEy[(k * ny * nx + j * nx + i)] + A[1] * (((oldHx[(k * ny * nx + j * nx + i)] - oldHx[((k - 1) * ny * nx + j * nx + i)]) / d[3]) - ((oldHz[(k * ny * nx + j * nx + i)] - oldHz[(k * ny * nx + j * nx + (i - 1))]) / d[3])); //4
+	}
+	__syncthreads();
+}
+__global__ void culcEz(double *Ez, double *oldEz, double *oldHx, double *oldHy, double *A, double *d)
+{
+	int i = blockIdx.x*blockDim.x + threadIdx.x+1;
+	int j = blockIdx.y*blockDim.y + threadIdx.y+1;
+	int k = blockIdx.z*blockDim.z + threadIdx.z;
+	if ((0<i) && (0<j) && (i < nx) && (j < ny) && (k < nz)) {
+		Ez[(k * ny * nx + j * nx + i)] = A[0] * oldEz[(k * ny * nx + j * nx + i)] + A[1] * (((oldHy[(k * ny * nx + j * nx + i)] - oldHy[(k * ny * nx + j * nx + (i - 1))]) / d[1]) - ((oldHx[(k * ny * nx + j * nx + i)] - oldHx[(k * ny * nx + (j - 1) * nx + i)]) / d[2])); //4
+	}
+	__syncthreads();
+}
+/*----------------------------磁界計算----------------------*/
+__global__ void culcHx(double *Ey, double *Ez, double *Hx, double *oldHx, double *A, double *d)
+{
+	int i = blockIdx.x*blockDim.x + threadIdx.x;
+	int j = blockIdx.y*blockDim.y + threadIdx.y;
+	int k = blockIdx.z*blockDim.z + threadIdx.z;
+	if ((0<i)&&(i<nx) && (j<ny - 1) && (k<nz - 1)) {
+		Hx[k * ny * nx + j * nx + i] = oldHx[k * ny * nx + j * nx + i] - (A[2] * (((Ez[k * ny * nx + (j + 1) * nx + i] - Ez[k * ny * nx + j * nx + i]) / d[2]) - ((Ey[(k + 1) * ny * nx + j * nx + i] - Ey[k * ny * nx + j * nx + i]) / d[3]))); //5
+	}
+	__syncthreads();
+}
+__global__ void culcHy(double *Ex, double *Ez, double *Hy, double *oldHy, double *A, double *d)
+{
+	int i = blockIdx.x*blockDim.x + threadIdx.x;
+	int j = blockIdx.y*blockDim.y + threadIdx.y;
+	int k = blockIdx.z*blockDim.z + threadIdx.z;
+	if ((0<j) && (i<nx - 1) && (j<ny) && (k<nz - 1)) {
+		Hy[k * ny * nx + j * nx + i] = oldHy[k * ny * nx + j * nx + i]- (A[2] * (((Ex[(k + 1) * ny * nx + j * nx + i] - Ex[k * ny * nx + j * nx + i]) / d[3]) - ((Ez[k * ny * nx + j * nx + (i + 1)] - Ez[k * ny * nx + j * nx + i]) / d[1]))); //6
+	}
+	__syncthreads();
+}
+__global__ void culcHz(double *Ex, double *Ey, double *Hz, double *oldHz, double *A, double *d)
+{
+	int i = blockIdx.x*blockDim.x + threadIdx.x;
+	int j = blockIdx.y*blockDim.y + threadIdx.y;
+	int k = blockIdx.z*blockDim.z + threadIdx.z;
+	if ((0<j) && (i<nx - 1) && j<(ny - 1) && k<nz) {
+		Hz[k * ny * nx + j * nx + i] = oldHz[k * ny * nx + j * nx + i]- (A[2] * (((Ey[k * ny * nx + j * nx + (i + 1)] - Ey[k * ny * nx + j * nx + i]) / d[1]) - ((Ex[k * ny * nx + (j + 1) * nx + i] - Ex[k * ny * nx + j * nx + i]) / d[2]))); //6
+	}
+	__syncthreads();
+}
 ```
-### 該当のソースコード
-/*--------------------------------------------メイン計算部分------------------------------------------------------------*/
-while (t[0]<2e-9) {
-		culcEx << <grid, block >> > (Ex_d, oldEx_d, oldHy_d, oldHz_d, A_d, d_d);
-		culcEy << <grid, block >> > (Ey_d, oldEy_d, oldHx_d, oldHz_d, A_d, d_d);
-		culcEz << <grid, block >> > (Ez_d, oldEz_d, oldHx_d, oldHy_d, A_d, d_d);
-		cudaDeviceSynchronize();
-		vin[0] = 1.0*sin(2.0e10*M_PI*t[0]);
-		cudaMemcpy(vin_d, vin, sizeof(double), cudaMemcpyHostToDevice);
-		Init << <grid, block >> > ( Ez_d, t_d, vin_d);
-		cudaDeviceSynchronize();
-		Init2 << <grid, block >> > (Ex_d, Ey_d, Ez_d);
-		cudaDeviceSynchronize();
-MurEx << <grid, block >> > (Ex_d, oldEx_d, A_d);
-		MurEy << <grid, block >> > (Ey_d, oldEy_d, A_d);
-		MurEz << <grid, block >> > (Ez_d, oldEz_d, A_d);
-		cudaDeviceSynchronize();
-		culct << <2,2 >> > (t_d);
-		t[0] += (dt / 2);
-		cudaDeviceSynchronize();
-		culcHx << <grid, block >> > (Ey_d, Ez_d, Hx_d, oldHx_d, A_d, d_d);
-		culcHy << <grid, block >> > (Ex_d, Ez_d, Hy_d, oldHy_d, A_d, d_d);
-		culcHz << <grid, block >> > (Ex_d, Ey_d, Hz_d, oldHz_d, A_d, d_d);
-		cudaDeviceSynchronize();
-		change << <grid, block >> > (Ex_d, Ey_d, Ez_d, oldEx_d, oldEy_d, oldEz_d, Hx_d, Hy_d, Hz_d, oldHx_d, oldHy_d, oldHz_d);
-		cudaDeviceSynchronize();
-		culct << <2, 2 >> > (t_d);
-		t[0] += (dt / 2);
-		cudaDeviceSynchronize();
-		output << <grid, block >> > (out_d, Ez_d);
-		cudaDeviceSynchronize();
-	}
-/*---------------------------------------------------------------------------------------------------------------------*/
-/*------------------吸収境界条件部分----------------------------*/
-__global__ void MurEx(double *Ex, double *oldEx, double *A){
-	int i = blockIdx.x*blockDim.x + threadIdx.x;
-	int j = blockIdx.y*blockDim.y + threadIdx.y;
-	int k = blockIdx.z*blockDim.z + threadIdx.z;
-	if (i < nx && j < ny && k < nz) {
-		Ex[(k * ny * nx + j * nx + 0)] =
-oldEx[(k * ny * nx + j * nx + 1)] + A[3] * (Ex[(k * ny * nx + j * nx + 1)] - oldEx[(k * ny * nx + j * nx + 0)]);
-		Ex[(k * ny * nx + j * nx + nx - 1)] = oldEx[(k * ny * nx + j * nx + nx - 2)] + A[3] * (Ex[(k * ny * nx + j * nx + nx - 2)] - oldEx[(k * ny * nx + j * nx + nx - 1)]);
-	}
-	__syncthreads();
-}
-__global__ void MurEy( double *Ey,  double *oldEy,  double *A){
-	int i = blockIdx.x*blockDim.x + threadIdx.x;
-	int j = blockIdx.y*blockDim.y + threadIdx.y;
-	int k = blockIdx.z*blockDim.z + threadIdx.z;
-	if (i < nx && j < ny && k < nz) {
-		Ey[(k * ny * nx + 0 * nx + i)] =
-oldEy[(k * ny * nx + 1 * nx + i)] + A[3] * (Ey[(k * ny * nx + 1 * nx + i)] - oldEy[(k * ny * nx + 0 * nx + i)]);
-		Ey[(k * ny * nx + (ny - 1) * nx + i)] =
-oldEy[(k * ny * nx + (ny - 2) * nx + i)] + A[3] * (Ey[(k * ny * nx + (ny - 2) * nx + i)] - oldEy[(k * ny * nx + (ny - 1) * nx + i)]);
-	}
-	__syncthreads();
-}
-__global__ void MurEz( double *Ez,  double *oldEz, double *A){
-	int i = blockIdx.x*blockDim.x + threadIdx.x;
-	int j = blockIdx.y*blockDim.y + threadIdx.y;
-	int k = blockIdx.z*blockDim.z + threadIdx.z;
-	if (i < nx && j < ny && k < nz) {
-		Ez[(k * ny * nx + j * nx + 0)] =
- oldEz[(k * ny * nx + j * nx + 1)] + A[3] * (Ez[(k * ny * nx + j * nx + 1)] - oldEz[(k * ny * nx + j * nx + 0)]);
-		Ez[(k * ny * nx + j * nx + nx - 1)] =
-oldEz[(k * ny * nx + j * nx + nx - 2)] + A[3] * (Ez[(k * ny * nx + j * nx + nx - 2)] - oldEz[(k * ny * nx + j * nx + nx - 1)]);
-		Ez[(k * ny * nx + 0 * nx + i)] =
-oldEz[(k * ny * nx + 1 * nx + i)] + A[3] * (Ez[(k * ny * nx + 1 * nx + i)] - oldEz[(k * ny * nx + 0 * nx + i)]);
-		Ez[(k * ny * nx + (ny - 1) * nx + i)]
-= oldEz[(k * ny * nx + (ny - 2) * nx + i)] + A[3] * (Ez[(k * ny * nx + (ny - 2) * nx + i)] - oldEz[(k * ny * nx + (ny - 1) * nx + i)]);
-	}
-	__syncthreads();
-}
-/*------------------------------------------------------------------------------*/
-//その他補足（プログラムより抜粋)
-♯define nx 41
-♯define ny 41
-♯define nz 41
-dim3 grid;
-	grid.x = 3;
-	grid.y = 3;
-	grid.z = 24;
-	dim3 block;
-	block.x = 16;
-	block.y = 16;
-	block.z = 2;
-/*--------------------------電磁界計算用係数設定------------------------*/
-	A[0] = ((1 - (sig*dt) / (2 * ep)) / (1 + (sig*dt) / (2 * ep)));
-	A[1] = (dt / ep) / (1 + (sig*dt / (2 * ep)));
-	A[2] = dt / mu;
-	A[3] = (c*dt - dx) / (c*dt + dx);
-	/*-----------------------------------------------
-	0:電界計算,1:電界計算,2:磁界計算,3:Mur吸収境界条件
-	-------------------------------------------------*/
-	d[0] = 2.0e-12;
-	d[1] = 1.5e-3;
-	d[2] = 1.5e-3;
-	d[3] = 1.5e-3;
-	/*-----------------------------------------------
-	0:dt,1:dx,2:dy,3:dz
-	-------------------------------------------------*/
-/*----------------------------電界計算----------------------*/
-__global__ void culcEx(double *Ex, double *oldEx, double *oldHy, double *oldHz, double *A, double *d)
-{
-	int i = blockIdx.x*blockDim.x + threadIdx.x;
-	int j = blockIdx.y*blockDim.y + threadIdx.y+1;
-	int k = blockIdx.z*blockDim.z + threadIdx.z+1;
-	if ((0 < j) && (0 < k) && (i < nx) && (j < ny) && (k < nz)) {
-		Ex[(k * ny * nx + j * nx + i)] = A[0] * oldEx[(k * ny * nx + j * nx + i)] + A[1] * (((oldHz[(k * ny * nx + j * nx + i)] - oldHz[(k * ny * nx + (j - 1) * nx + i)]) / d[2]) - ((oldHy[(k * ny * nx + j * nx + i)] - oldHy[((k - 1) * ny * nx + j * nx + i)]) / d[3])); //4
-	}
-	__syncthreads();
-}
-__global__ void culcEy(double *Ey, double *oldEy, double *oldHx, double *oldHz, double *A, double *d)
-{
-	int i = blockIdx.x*blockDim.x + threadIdx.x+1;
-	int j = blockIdx.y*blockDim.y + threadIdx.y;
-	int k = blockIdx.z*blockDim.z + threadIdx.z+1;
-	if ((0<i) && (0<k) && (i < nx) && (j < ny) && (k < nz)) {
-		Ey[(k * ny * nx + j * nx + i)] = A[0] * oldEy[(k * ny * nx + j * nx + i)] + A[1] * (((oldHx[(k * ny * nx + j * nx + i)] - oldHx[((k - 1) * ny * nx + j * nx + i)]) / d[3]) - ((oldHz[(k * ny * nx + j * nx + i)] - oldHz[(k * ny * nx + j * nx + (i - 1))]) / d[3])); //4
-	}
-	__syncthreads();
-}
-__global__ void culcEz(double *Ez, double *oldEz, double *oldHx, double *oldHy, double *A, double *d)
-{
-	int i = blockIdx.x*blockDim.x + threadIdx.x+1;
-	int j = blockIdx.y*blockDim.y + threadIdx.y+1;
-	int k = blockIdx.z*blockDim.z + threadIdx.z;
-	if ((0<i) && (0<j) && (i < nx) && (j < ny) && (k < nz)) {
-		Ez[(k * ny * nx + j * nx + i)] = A[0] * oldEz[(k * ny * nx + j * nx + i)] + A[1] * (((oldHy[(k * ny * nx + j * nx + i)] - oldHy[(k * ny * nx + j * nx + (i - 1))]) / d[1]) - ((oldHx[(k * ny * nx + j * nx + i)] - oldHx[(k * ny * nx + (j - 1) * nx + i)]) / d[2])); //4
-	}
-	__syncthreads();
-}
-/*----------------------------磁界計算----------------------*/
-__global__ void culcHx(double *Ey, double *Ez, double *Hx, double *oldHx, double *A, double *d)
-{
-	int i = blockIdx.x*blockDim.x + threadIdx.x;
-	int j = blockIdx.y*blockDim.y + threadIdx.y;
-	int k = blockIdx.z*blockDim.z + threadIdx.z;
-	if ((0<i)&&(i<nx) && (j<ny - 1) && (k<nz - 1)) {
-		Hx[k * ny * nx + j * nx + i] = oldHx[k * ny * nx + j * nx + i] - (A[2] * (((Ez[k * ny * nx + (j + 1) * nx + i] - Ez[k * ny * nx + j * nx + i]) / d[2]) - ((Ey[(k + 1) * ny * nx + j * nx + i] - Ey[k * ny * nx + j * nx + i]) / d[3]))); //5
-	}
-	__syncthreads();
-}
-__global__ void culcHy(double *Ex, double *Ez, double *Hy, double *oldHy, double *A, double *d)
-{
-	int i = blockIdx.x*blockDim.x + threadIdx.x;
-	int j = blockIdx.y*blockDim.y + threadIdx.y;
-	int k = blockIdx.z*blockDim.z + threadIdx.z;
-	if ((0<j) && (i<nx - 1) && (j<ny) && (k<nz - 1)) {
-		Hy[k * ny * nx + j * nx + i] = oldHy[k * ny * nx + j * nx + i]- (A[2] * (((Ex[(k + 1) * ny * nx + j * nx + i] - Ex[k * ny * nx + j * nx + i]) / d[3]) - ((Ez[k * ny * nx + j * nx + (i + 1)] - Ez[k * ny * nx + j * nx + i]) / d[1]))); //6
-	}
-	__syncthreads();
-}
-__global__ void culcHz(double *Ex, double *Ey, double *Hz, double *oldHz, double *A, double *d)
-{
-	int i = blockIdx.x*blockDim.x + threadIdx.x;
-	int j = blockIdx.y*blockDim.y + threadIdx.y;
-	int k = blockIdx.z*blockDim.z + threadIdx.z;
-	if ((0<j) && (i<nx - 1) && j<(ny - 1) && k<nz) {
-		Hz[k * ny * nx + j * nx + i] = oldHz[k * ny * nx + j * nx + i]- (A[2] * (((Ey[k * ny * nx + j * nx + (i + 1)] - Ey[k * ny * nx + j * nx + i]) / d[1]) - ((Ex[k * ny * nx + (j + 1) * nx + i] - Ex[k * ny * nx + j * nx + i]) / d[2]))); //6
-	}
-	__syncthreads();
-}

誤字

2018/10/13 10:21

投稿

run919

スコア10

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -448,11 +448,7 @@
 i = blockIdx.x*blockDim.x + threadIdx.x+1;のようにしてみたり
-メイン関数中のMurE関数がくるところを
-のように変更してCPUで計算させてもみましたがダメでした。
+メイン関数中のMurE関数がくるところを変更してCPUで計算させてもみましたがダメでした。
 ### 補足情報（FW/ツールのバージョンなど）