CUDA随机数生成库curand—

原创作品，如要转载请注明出处:http://www.cnblogs.com/shrimp-can/p/6590152.html

最近要在device函数中使用curand库生成随机数，查找了下资料，除了NVIDIA官网的介绍外，其他介绍deviceAPI的我没有找到，倒是介绍hostAPI的一大堆，因此简单整理下自己所理解的deviceAPI的使用。

一、简介

curand由两部分组成：host端的库和device端的头文件。

host端的库就像其他的CPU库一样curand.h，随机数可以在设备端生成或者CPU端生成。在设备端生成的时候，对库的调用发生在host端，但是随机数的生成实际上发生在device端，随机数存储在global memory中，用户可以调用kernel直接使用这个随机数，也可以将此随机数拷贝回kernel。

device端的库头文件curand_kernel.h，这个头文件里面定义了设置随机数生成器的状态以及生成一系列随机数的设备函数，使得kernel可以调用函数生成随机数，而不需要从global memory处读写。

二、device API

包含头文件curand_kernel.h，工程需要链接到库curand。

使用curand的deviceAPI生成随机数主要需要三个步骤

a．创建一个随机算法状态的对象，如curandState state

b．对状态进行初始化，使用curand_init（）函数

c．生成随机数，使用curand等

deviceAPI的作用也是这些，下面进行更详细的介绍

１．创建随机算法状态对象

在deviceAPI中，有４中为随机算法，４种真随机算法

伪随机算法　　　　　对应的状态

Mtgp32 curandStateMtgp32_t

MRG32k3a curandStateMRG32k3a_t

Philox4_32_10 curandStatePhilox4_32_10_t

XORWOW curandStateWORWOW_t

真随机算法　　　　　对应的状态

scrambled Sobol64 curandStateScrambledSobol64_t

Sobol64　 curandStateSobol64_t

scrambled Sobol32 curandStateScrambledSobol32_t

Sobol32　 curandStateSobol32_t

如要创建算法XORWOW状态对象：curandStateWORWOW_t state

２．对算法状态进行初始化

curand_init()函数，不同的算法，函数的参数不相同，具体算法所需要的参数可以看NVIDIA官网curand_initAPI：http://docs.nvidia.com/cuda/curand/group__DEVICE.html#group__DEVICE

对于除了MTGP32的伪随机算法，初始化参数都是：种子、序列、偏移、要初始化的随机算法状态对象

注意：算法MTGP32的初始化是通过两个hostAPI，curandMakeMTGP32Constants和cirandMakeMTGP32KernelState

如要初始化算法XORWOW状态对象：curand_init ( unsigned long long seed, unsigned long long subsequence, unsigned long long offset, curandStateXORWOW_t* state )

３．生成随机数

生成随机数除了可以使用不同的算法（由参数决定）以外，还能生成不同分布、不同浮点类型的随机数，这根据调用的生成随机数的API决定。

主要有以下几种API：

curand 生成unsigned int型整数，没有特殊分布

curand_uniform 生成服从均匀分布的float

curand_uniform4 生成4个服从均匀分布的float

curand_uniform_double　生成服从均匀分布的double

curand_uniform2_double 生成2个服从均匀分布的double

curand_poisson　生成服从泊松分布的int

curand_poisson4　生成４个服从泊松分布的int

curand_normal　生成服从正态分布的float

curand_normal2　生成２个服从正态分布的float

curand_normal4　生成４个服从正态分布的float

curand_normal_double　生成服从正态分布的double

curand_normal2_double　生成２个服从正态分布的double

curand_log_normal　生成服从对数正态分布的float

curand_log_normal2 生成2个服从对数正态分布的float

curand_log_normal4 生成４个服从对数正态分布的float

curand_log_normal_double 生成服从对数正态分布的double

curand_log_normal2_double 生成２个服从对数正态分布的double

curand_mtgp32_single　生成mtgp32算法中服从均匀分布的float

curand_mtgp32_single_specific 生成mtgp32算法中服从特殊泊松分布的float

curand_mtgp32_specific 生成mtgp32算法中的32bits的int

如要生成一个int型的随机数，采用XORWOW算法：curand(curandStateXORWOW_t* state)

以上是个人理解，如有错误的地方，忘批评指正

urand_mtgp32_single　生成mtgp32算法中服从均匀分布的floa

curand_log_normal2 生成2个服从对数正态分布的float_log_normal　生成服从对数正态分布的floatcurand_log_normal　生成服从对数正态分布的floatcu

curand_log_normal　生成服从对数正态分布的floa

curand_log_normal　生成服从对数正态分布的floacurand_log_normal　生成服从对数正态分布的floacurand_log_normal　生成服从对数正态分布的f

CUDA随机数生成库curand——deviceAPI的更多相关文章

CUDA数学库
CUDA数学库高性能数学例程 CUDA数学库是经过行业验证的,高度准确的标准数学函数的集合.只需在源代码中添加" #include math.h",即可用于任何CUDA C或CU ...
cuda npp库旋转图片
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <assert.h&g ...
NVIDIA GPU上的随机数生成
NVIDIA GPU上的随机数生成 NVIDIA CUDA随机数生成库(cuRAND)提供高性能的GPU加速的随机数生成(RNG).cuRAND库使用NVIDIA GPU中提供的数百个处理器内核,将质 ...
ubuntu16.04 Detectron目标检测库配置（包含GPU驱动，Cuda，Caffee2等配置梳理）
Detectron概述 Detectron是Facebook FAIR开源了的一个目标检测(Object Detection)平台. 用一幅图简单说明下Object Detection.如Mask R ...
CUDA基础介绍
一.GPU简介 1985年8月20日ATi公司成立,同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡,1992年4月ATi发布了Mach32图形卡集成了图形加速功能,1998年4月ATi ...
第一篇：CUDA 6.0 安装及配置( WIN7 64位 / 英伟达G卡 / VS2010 )
前言本文讲解如何在VS 2010开发平台中搭建CUDA开发环境. 当前配置: 系统:WIN7 64位开发平台:VS 2010 显卡:英伟达G卡 CUDA版本:6.0 若配置不同,请谨慎参考本文. ...
ubuntu16.04+caffe+GPU+cuda+cudnn安装教程
步骤简述: 1.安装GPU驱动(系统适配,不采取手动安装的方式) 2.安装依赖(cuda依赖库,caffe依赖) 3.安装cuda 4.安装cudnn(只是复制文件加链接,不需要编译安装的过程) 5. ...
[翻译]CURAND Libaray--Host API--(2)
Translated by xingoo 如果有错误请联系:xinghl90@gmail.com 2.3 返回值所有的CURAND host端的函数返回值都是curandStatus_t.如果调用没 ...
cuda在ubuntu的安装使用分享
前言之前给大家分享过opencv在jetson nano 2gb和ubuntu设备中使用并且展示了一些人脸识别等的小demo.但是对于图像处理,使用gpu加速是很常见 .(以下概念介绍内容来自百科和 ...

随机推荐

java批量爬去电影资源
摘要网上有很多个人站来分享电影资源,其实有时候我们自己也想做这个一个电影站来分享资源.但是这个时候就有一个问题,电影的资源应该从哪里来呢?难道要自己一条条手动去从网络上获取,这样无疑是缓慢而又效率低 ...
PL/SQL基本概念
首先明确PL/SQL主要作用作用: SQL语言适合管理关系型数据库但是它无法满足更复杂的数据处理,所以产生PLSQL.PLSQL用户创建存储过程.函数.触发器.包及用户自定义的函数. 特点: PLSQ ...
java 文件操作写入和读取（小结一）
参考了这篇博客并优化,谢谢:http://blog.sina.com.cn/s/blog_99201d890101b4le.html 功能: 实现通过两个类完成先写入文件,再读取数据计算显示 pac ...
OSS.Social微信项目标准库介绍
经过本周的努力,昨晚终于完成OSS.Social微信项目的标准库支持,当前项目你已经可以同时在.net framework和.net core 中进行调用,调用方法也发生了部分变化,这里我简单分享下, ...
ACM入门:第s名的小红
前几天的大一新生赛自己也跟着做了做,顺便测测后台数据有没有bug,这是一道排序题,题目如下: Problem Description 小红总是排第二,有点不服气,现在她想知道一个序列中第二小的数字是多 ...
！important的理解
!important用于将当前css代码优先级提升为最高,这个优先级比行内样式更高但是!important在ie6这种垃圾浏览器下会出现小bug .testClass{ color:blue !im ...
iOS开发～制作同时支持armv7,armv7s,arm64,i386,x86_64的静态库.a
一.概要平时项目开发中,可能使用第三方提供的静态库.a,如果.a提供方技术不成熟,使用的时候就会出现问题,例如: 在真机上编译报错:No architectures to compile for ( ...
devexpress表格gridcontrol实现分组，并根据分组计算总计及平均值
1.devexpress表格控件gridcontrol提供了强大的分组功能,你几乎不用写什么代码就可以实现一个分组功能,并且可根据分组计算总计和平均值.这里我例举了一个实现根据班级分组计算班级总人数, ...
BZOJ 3390: [Usaco2004 Dec]Bad Cowtractors牛的报复（最大生成树）
这很明显就是最大生成树= = CODE： #include<cstdio>#include<iostream>#include<algorithm>#include ...
git合并别的分支某次提交或合并
合并别的分支某次提交 master分支上改了一个bug.提交到master分支.现在在dev分支上开发,需要把master分支上改的那个bug合过来.步骤是:先在master分支上查改那个bug的SH ...

CUDA随机数生成库curand——deviceAPI

CUDA随机数生成库curand——deviceAPI的更多相关文章

随机推荐

热门专题