前言 本文讨论如何使用 CUDA 对代码进行并行优化,并给出不同并行思路对均值滤波的实现. 并行优化的两种思路 思路1: global 函数 在 global 函数中创建出多个块多个线程对矩阵每个元素进行并行计算 请参考:http://www.cnblogs.com/scut-fm/p/3750119.html 思路2: CUDA 库 将遍历矩阵分别对每个元素的操作转化成以矩阵整体为单位的操作 请参考:http://www.cnblogs.com/scut-fm/p/3756242.html 两
前言 本文讨论如何使用 CUDA 对代码进行并行优化,并给出不同并行思路对均值滤波的实现. 并行优化的两种思路 思路1: global 函数 在 global 函数中创建出多个块多个线程对矩阵每个元素进行并行计算 请参考:http://www.cnblogs.com/scut-fm/p/3750119.html 思路2: CUDA 库 将遍历矩阵分别对每个元素的操作转化成以矩阵整体为单位的操作 请参考:http://www.cnblogs.com/scut-fm/p/3756242.html 两