CUDA Samples: Long Vector Add】的更多相关文章

以下CUDA sample是分别用C++和CUDA实现的两向量相加操作,参考CUDA 8.0中的sample:C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\0_Simple,并对其中使用到的CUDA函数进行了解说,各个文件内容如下: common.hpp: #ifndef FBC_CUDA_TEST_COMMON_HPP_ #define FBC_CUDA_TEST_COMMON_HPP_ #define PRINT_ERROR_INFO…
以下CUDA sample是分别用C++和CUDA实现的两个非常大的向量相加操作,并对其中使用到的CUDA函数进行了解说,各个文件内容如下: common.hpp: #ifndef FBC_CUDA_TEST_COMMON_HPP_ #define FBC_CUDA_TEST_COMMON_HPP_ #include<random> template< typename T > static inline int check_Cuda(T result, const char *…
以下CUDA sample是分别用C++和CUDA实现的两矩阵相乘运算code即C= A*B,CUDA中包含了两种核函数的实现方法,第一种方法来自于CUDA Samples\v8.0\0_Simple\matrixMul,第二种采用普通的方法实现,第一种方法较快,但有些复杂,速度上约为第二种的1.3倍,并对其中使用到的CUDA函数进行了解说,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #incl…
2.3.1. Creating CUDA Projects for Windows 略 2.3.2  Creating CUDA Projects for Linux 默认的samples的安装路径 <SAMPLES_INSTALL_PATH> 是 NVIDIA_CUDA_5.5_Samples 并且示例程式的分为六类 : 0_Simple,1_Utilities, 2_Graphics, 3_Imaging, 4_Finance, 5_Simulations,6_Advanced, 7_CU…
示例代码分为下列几类: 1.   Simple Reference 基础CUDA示例,适用于初学者, 反应了运用CUDA和CUDA runtime APIs的一些基本概念. 2.   Utilities Reference 演示如何查询设备能力和衡量GPU/CPU 带宽的实例程序. 3.  Graphics Reference      图形化示例展现的是 CUDA, OpenGL, DirectX 之间的互通性 4.  Imaging Reference 图像处理,压缩,和数据分析 5.  F…
通过调用CUDA的cudaGetDeviceProperties函数可以获得指定设备的相关信息,此函数会根据GPU显卡和CUDA版本的不同得到的结果也有所差异,下面code列出了经常用到的设备信息: #include "funset.hpp" #include <iostream> #include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_"…
以下CUDA sample是分别用C++和CUDA实现的计算一维直方图,并对其中使用到的CUDA函数进行了解说,code参考了<GPU高性能编程CUDA实战>一书的第九章,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #include <iostream> #include <vector> #include <memory> #include &l…
cudaMalloc()分配的指针有使用限制,设备指针的使用限制总结如下: 1.可以将其传递给在设备上执行的函数 2.可以在设备代码中使用其进行内存的读写操作 3.可以将其传递给在主机上执行的函数 4.不能在主机代码中使用其进行内存的读写操作 总的来说就是主机指针只能访问主机代码中的内存,设备指针只能访问设备代码中的内存 这是两个数相加的cuda代码: #include<iostream>using namespace std; __global__ void add(int a,int b,…
以下CUDA sample是分别用C++和CUDA实现的点积运算code,CUDA包括普通实现和采用零拷贝内存实现两种,并对其中使用到的CUDA函数进行了解说,code参考了<GPU高性能编程CUDA实战>一书的第十一章,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #include <iostream> #include <vector> #include &…
以下CUDA sample是分别用C++和CUDA实现的流的使用code,并对其中使用到的CUDA函数进行了解说,code参考了<GPU高性能编程CUDA实战>一书的第十章,各个文件内容如下: funset.cpp: #include "funset.hpp" #include <random> #include <iostream> #include <vector> #include <memory> #include &…