转自:http://blog.sina.com.cn/s/blog_48b9e1f90100fm5b.html 一个grid中的所有线程执行相同的内核函数,通过坐标进行区分.这些线程有两级的坐标,blockId和threadId,由CUDA runtime system指定.grimDim.x标识block在x维度上的数目,gridDim.y标识block在y维度上的数目.例如, 在启动内核时指定: dim3 dimBlock(4,2,2); dim3 dimGrid(2,2,1); Kerne…