CUDA计算模型 CUDA中计算分为两部分,串行部分在Host上执行,即CPU,而并行部分在Device上执行,即GPU. 相比传统的C语言,CUDA增加了一些扩展,包括了库和关键字. CUDA代码提交给NVCC编译器,该编译器将代码分为Host代码和Device代码两部分. Host代码即为原本的C语言,交由GCC,ICC或其他的编译器处理: Device代码部分交给一个称为实时(Just in time)编译器的组件,在给代码运行之前编译.Device code编译成类似java的字节码文件