Some fixes (f8dcb719) · Commits · TNL / tnl-dev

examples/fast-sweeping/main.h

+2 −2

Original line number	Diff line number	Diff line
		@@ -17,9 +17,9 @@

		#include "MainBuildConfig.h"
		//for HOST versions:
		#include "tnlFastSweeping.h"
		//#include "tnlFastSweeping.h"
		//for DEVICE versions:
		//#include "tnlFastSweeping_CUDA.h"
		#include "tnlFastSweeping_CUDA.h"
		#include "fastSweepingConfig.h"
		#include <solvers/tnlConfigTags.h>

examples/hamilton-jacobi-parallel/tnlParallelEikonalSolver3D_impl.h

+16 −13

Original line number	Diff line number	Diff line
		@@ -1023,7 +1023,8 @@ __device__
		void tnlParallelEikonalSolver<3,SchemeHost, SchemeDevice, Device, double, int>::getSubgridCUDA3D( const int i ,tnlParallelEikonalSolver<3,SchemeHost, SchemeDevice, Device, double, int >* caller, double* a)
		{
		//int j = threadIdx.x + threadIdx.y * blockDim.x;
		int th = (blockIdx.y) * caller->ncaller->ncaller->gridCols
		int th = (blockIdx.zcaller->n + threadIdx.z) caller->ncaller->ncaller->gridCols*caller->gridRows
		(blockIdx.y) * caller->ncaller->ncaller->gridCols
		+ (blockIdx.x) * caller->n
		+ threadIdx.y * caller->n*caller->gridCols
		+ threadIdx.x;
		@@ -1038,8 +1039,9 @@ template< typename SchemeHost, typename SchemeDevice, typename Device>
		__device__
		void tnlParallelEikonalSolver<3,SchemeHost, SchemeDevice, Device, double, int>::updateSubgridCUDA3D( const int i ,tnlParallelEikonalSolver<3,SchemeHost, SchemeDevice, Device, double, int >* caller, double* a)
		{
		int j = threadIdx.x + threadIdx.y * blockDim.x;
		int index = (blockIdx.y) * caller->ncaller->ncaller->gridCols
		// int j = threadIdx.x + threadIdx.y * blockDim.x;
		int index = (blockIdx.zcaller->n + threadIdx.z) caller->ncaller->ncaller->gridCols*caller->gridRows
		(blockIdx.y) * caller->ncaller->ncaller->gridCols
		+ (blockIdx.x) * caller->n
		+ threadIdx.y * caller->n*caller->gridCols
		+ threadIdx.x;
		@@ -1064,9 +1066,10 @@ void tnlParallelEikonalSolver<3,SchemeHost, SchemeDevice, Device, double, int>::
		// int j = threadIdx.x + threadIdx.y * blockDim.x;
		//printf("j = %d, u = %f\n", j,u);

		int index = (blockIdx.y)this->nthis->n*this->gridCols
		+ (blockIdx.x)*this->n
		+ threadIdx.ythis->nthis->gridCols
		int index = (blockIdx.zcaller->n + threadIdx.z) caller->ncaller->ncaller->gridCols*caller->gridRows
		(blockIdx.y) * caller->ncaller->ncaller->gridCols
		+ (blockIdx.x) * caller->n
		+ threadIdx.y * caller->n*caller->gridCols
		+ threadIdx.x;

		//printf("i= %d,j= %d,index= %d\n",i,j,index);