模板是C++的一个重要特征,它可以让我们简化代码,同时使代码更整洁.CUDA中也支持模板,这给我们编写cuda程序带来了方便.不过cuda4.0之前和之后使用模板的方法不一样,这给我们带来了少许困难.在cuda4.0之前,模板的使用和C++中无区别,使用非常方便,在此不做过多介绍.不过在cuda4.0之后,由于编译器的升级,导致之前的模板使用方法不再有效,我们需要重新设计代码. 如果按照之前的方式编写代码,如下面简单示例: template <type T> __global__ void f…