以下CUDA sample是分别用C++和CUDA实现的模拟热传导生成的图像,并对其中使用到的CUDA函数进行了解说,code参考了<GPU高性能编程CUDA实战>一书的第七章,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #include <iostream> #include <vector> #include <memory> #include…
示例代码分为下列几类: 1.   Simple Reference 基础CUDA示例,适用于初学者, 反应了运用CUDA和CUDA runtime APIs的一些基本概念. 2.   Utilities Reference 演示如何查询设备能力和衡量GPU/CPU 带宽的实例程序. 3.  Graphics Reference      图形化示例展现的是 CUDA, OpenGL, DirectX 之间的互通性 4.  Imaging Reference 图像处理,压缩,和数据分析 5.  F…
2.3.1. Creating CUDA Projects for Windows 略 2.3.2  Creating CUDA Projects for Linux 默认的samples的安装路径 <SAMPLES_INSTALL_PATH> 是 NVIDIA_CUDA_5.5_Samples 并且示例程式的分为六类 : 0_Simple,1_Utilities, 2_Graphics, 3_Imaging, 4_Finance, 5_Simulations,6_Advanced, 7_CU…
通过调用CUDA的cudaGetDeviceProperties函数可以获得指定设备的相关信息,此函数会根据GPU显卡和CUDA版本的不同得到的结果也有所差异,下面code列出了经常用到的设备信息: #include "funset.hpp" #include <iostream> #include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_"…
以下CUDA sample是分别用C++和CUDA实现的两矩阵相乘运算code即C= A*B,CUDA中包含了两种核函数的实现方法,第一种方法来自于CUDA Samples\v8.0\0_Simple\matrixMul,第二种采用普通的方法实现,第一种方法较快,但有些复杂,速度上约为第二种的1.3倍,并对其中使用到的CUDA函数进行了解说,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #incl…
以下CUDA sample是分别用C++和CUDA实现的两向量相加操作,参考CUDA 8.0中的sample:C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\0_Simple,并对其中使用到的CUDA函数进行了解说,各个文件内容如下: common.hpp: #ifndef FBC_CUDA_TEST_COMMON_HPP_ #define FBC_CUDA_TEST_COMMON_HPP_ #define PRINT_ERROR_INFO…
以下CUDA sample是分别用C++和CUDA实现的点积运算code,CUDA包括普通实现和采用零拷贝内存实现两种,并对其中使用到的CUDA函数进行了解说,code参考了<GPU高性能编程CUDA实战>一书的第十一章,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #include <iostream> #include <vector> #include &…
以下CUDA sample是分别用C++和CUDA实现的流的使用code,并对其中使用到的CUDA函数进行了解说,code参考了<GPU高性能编程CUDA实战>一书的第十章,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #include <iostream> #include <vector> #include <memory> #include &…
以下CUDA sample是分别用C++和CUDA实现的计算一维直方图,并对其中使用到的CUDA函数进行了解说,code参考了<GPU高性能编程CUDA实战>一书的第九章,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #include <iostream> #include <vector> #include <memory> #include &l…
以下CUDA sample是分别用C++和CUDA实现的生成光线跟踪图像,并对其中使用到的CUDA函数进行了解说,code参考了<GPU高性能编程CUDA实战>一书的第六章,CUDA各实现包括了使用常量内存和不使用常量内存两种方法,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #include <iostream> #include <vector> #incl…