CUDA是GPU通用计算的一种,其中现在大热的深度学习底层GPU计算差不多都选择的CUDA,在这我们先简单了解下其中的一些概念,为了好理解,我们先用DX11里的Compute shader来和CUDA比较下,这二者都可用于GPU通用计算. 先上一张微软MSDN上的图. Compute shader: 线程块: Dispatch(x,y,z), 索引SV_GroupID 线程组: [numthreads(SIZE_X, SIZE_Y, 1)], 索引SV_GroupThreadID. 组内索引:…