【转载】opencl中设备内存
地址空间限定符
一般的内核代码中,里面的内核参数或声明变量时,都会有地址空间限定符
地址空间限定符,地址空间限定符的主要作用是指出数据应该保存在哪个地方
地址空间限定符有4个:
全局内存:
限定符:__global.保存一个设备中的数据,可读也可写,这意味着一个设备中的各个工作组、各个工作项是可以共享的,
主机和设备都可以读写访问,当主机应用程序将缓存对象传输给设备,缓存数据是存放在全局/常数空间中,当主机从设备中
读取缓存对象,数据将来自设备的全局内存。全局/常数内存往往是一个opencl兼容设备上最大的内存区域,但是访问速度最慢。从这里可以看出
全局区域主要用于主机和设备之间进行数据传输。
常数内存:
限定符:__constant.和全局内存相似,但是只可以读。其在使用前必须要初始化
局部内存:
限定符:__local.保存工作组中工作项的数据,这意味着,局部内存在同一个工作组内存是可以共享的.
这种类型的数据只会针对处理内核的各个工作组分配一次,然后在工作组处理结束之后释放内存
私有内存:
限定符:__private。只在一个工作项中有效,需要注意的是,如果内核参数或者内核程序中的变量声明没有加限定符,
那么他将被保存在私有内存中。如果指针变量没有加限定符,他就会被设置指向私有内存。但image2d_t和image3d_t型指针会一直指向全局内存
限定符所限定的对象:
__global:可以限定所有的内核参数,并不仅仅是指针参数。除了参数之外,还可以限定内核之中所声明的指针变量。
__local:可以用于限定内核参数以及内核中声明的变量,但需要特别注意的是,不管是主机还是设备,都不能够对其进行直接初始化
如,下面会报错:
__local float x = 4.0;
这样会报错,解决办法是:
__local float x;
x = 4.0;
__private:可以限定可以用于限定内核参数以及所有非内涵函数的参数和变量。
主机配置局部内存
主机与设别之间的数据通信是通过全局内存实现的,这意味着主机不能读写局部、私有内存。但是主机可以配置局部、私有内存。
比如,主机可以告诉设备如何为内核参数分配局部内存。
为了编程配置整个过程,需要将clSetKernelArg函数的最后一个参数设为NULL。如下面由主机执行的代码,用来配置局部参数,
分配足够保存16个浮点数的内存空间:
slSetKernelArg(kernel,0,16*sizeof(float),NULL);
对应的内核函数:
__kernel void proc_data(__local float* nums,...)
{
}
和全局内存相似,局部内存的访问速度更快,因此,最好是先将数据从全局内存读取到局部内存中,然后在局部内存中进行处理。在工作项处理
完局部数据之后,再将结果写到全局内存中,再传输回主机。
主机配置私有内存
私有内存的访问速度最快,但是内存空间最小。
和局部内存不一样,内核参数的私有数据可以由主机来进行初始化。为了配置私有内存数据,主机需要将clSetKernelArg函数
最后一个参数设定为基本数据类型,如int*、float*,char*等,但内核函数中对应的私有内核参数必须是基本数据类型,对应为int、float、char等。
下面的例子是:内核需要每个工作项都能够访问int变量num_iteration所在的地址空间,并且希望其初始化值为4,对应的主机程序:
int num_iteration = 4;
clSetKernelArg(kernel,0,sizeof(num_iteration),&num_iteration);
对应的内核函数:
__kernel void proc_data(int num_iteration,...)
{
}
该内核函数参数没有限定符,因此默认是私有内存,那么每一个工作项都会有一个自己的副本
该参数和以前的参数不一样,num_iteration不是一个指针。私有内核参数并不是引用,它们必须是像int和float那样的基本数据类型
全局/常数数据只能通过引用传递的方式给内核,而私有数据是值传递的方式
私有内核参数必须是基本数据类型,但是不一定需要是标量,也可以是向量。例如,你想将四个float型数据发送给内核,然后
再将float型数放到设备的私有地址空间中,以便快速访问,在主机应用程序中。可以加入下面的代码来实现这个目的:
float nums[4] = {0.0f,1.0f,2.0f,3.0f};
clSetKernelArg(kernel,0,sizeof(nums),nums);
内核不能以4元素数组的形式访问私有数据,因为私有参数不能是指针,但是数据可以以float4型向量的形式来访问:
__kernel void proc_data(float4 vaues,...)
{
...
}
简单总结:
如果在调用clSetKernelArg函数时,指针指向内存对象(cl_mem),那么对应的内核参数必须是声明为__global或__constant类型的指针。
如果调用clSetKernelArg函数时,指针被声明NULL,对应的内核参数必须被声明为__local类型的指针,且主机程序能够做的只是告诉设备如何为内核参数分配局部内存
如果调用clSetKernelArg函数时,指针指向的是基本数据类型,内核参数就不会是指针,也不需要有任何地址限定符。
【转载】opencl中设备内存的更多相关文章
- (转载)JVM中的内存模型与垃圾回收
转载自微信公众号:Java高级架构(Java-jiagou)-----看完这篇文章,我奶奶都知道JVM中的内存模型与垃圾回收了! 六.内存模型 6.1 内存模型与运行时数据区 Java虚拟机在执行J ...
- [图解tensorflow源码] [转载] tensorflow设备内存分配算法解析 (BFC算法)
转载自 http://weibo.com/p/1001603980563068394770 @ICT_吴林阳 tensorflow设备内存管理模块实现了一个best-fit with coales ...
- windows进程中的内存结构[转载]
在阅读本文之前,如果你连堆栈是什么多不知道的话,请先阅读文章后面的基础知识. 接触过编程的人都知道,高级语言都能通过变量名来访问内存中的数据.那么这些变量在内存中是如何存放的呢?程序又是如何使用这些变 ...
- [转载]Java应用程序中的内存泄漏及内存管理
近期发现测试的项目中有JAVA内存泄露的现象.虽然JAVA有垃圾回收的机制,但是如果不及时释放引用就会发生内存泄露现象.在实际工作中我们使用Jprofiler调用java自带的 jmap来做检测还是很 ...
- Unity 3D中的内存管理
本文欢迎转载,但烦请保留此行出处信息:http://www.onevcat.com/2012/11/memory-in-unity3d/ Unity3D在内存占用上一直被人诟病,特别是对于面向移动设备 ...
- 【转】cocos2d-x与ios内存管理分析(在游戏中减少内存压力)
猴子原创,欢迎转载.转载请注明: 转载自Cocos2D开发网–Cocos2Dev.com,谢谢! 原文地址: http://www.cocos2dev.com/?p=281 注:自己以前也写过coco ...
- 关于Hash集合以及Java中的内存泄漏
<学习笔记>关于Hash集合以及Java中的内存泄漏 标签: 学习笔记内存泄露hash 2015-10-11 21:26 58人阅读 评论(0) 收藏 举报 分类: 学习笔记(5) 版 ...
- Linux就这个范儿 第15章 七种武器 linux 同步IO: sync、fsync与fdatasync Linux中的内存大页面huge page/large page David Cutler Linux读写内存数据的三种方式
Linux就这个范儿 第15章 七种武器 linux 同步IO: sync.fsync与fdatasync Linux中的内存大页面huge page/large page David Cut ...
- 查看linux中swap内存的相关参数
内容主要来源于:linux的内存回收和交换 各项命令查看的linux环境是:Linux SUSE-33 2.6.32.12-0.7-defaul zone? 内存管理的相关逻辑都是以zone为单位的, ...
随机推荐
- 「SNOI2019」通信 分治优化费用流建图
题意: n 个排成一列的哨站要进行通信.第 i 个哨站的频段为 ai. 每个哨站 ii 需要选择以下二者之一: 1.直接连接到控制中心,代价为 W:2.连接到前面的某个哨站 j(j<i),代价为 ...
- zabbix--监控的组件和进程介绍
上图是zabbix的架构,zabbix proxy(代理),可以减小IO并发. zabbix web GUI是用php写的画图工具,从数据库抓取数据. zabbix database zabbix获取 ...
- 微信app支付返回-1的问题
我也是被坑就当留个纪念 前两天查了各种关于微信app支付返回-1的都是ERR_COMM 问题然后各种 验证最后还是误解 第三天去验证了一下微信开放平台发现了问题 appid 不在同一个开放平台 项目之 ...
- UIPageViewController看这篇就够了
先说初始化 - (UIPageViewController *)PageViewController{ if(!_PageViewController){ //书脊位置,只有在UIPageViewCo ...
- Django完成常用四大功能
返回主目录:Django框架 内容目录: 1.pycharm连接数据库及相应操作 2.手撸登录注册编辑删除 2.1 登录.注册 2.2 ORM简单操作 2.3 编辑.删除 3.完整代码 一.pycha ...
- Ruby 环境
Ruby 环境 本地环境设置 如果您想要设置 Ruby 编程语言的环境,请阅读本章节的内容.本章将向您讲解与环境设置有关的所有重要的主题.建议先学习下面几个主题,然后再进一步深入学习其他主题: Lin ...
- 干货满满!解密阿里云RPA (机器人流程自动化)的产品架构和商业化发展
阿里云RPA,作为阿里云自研8年的技术,在资本的热捧下,逐渐从幕后来到台前,成为企业服务市场的黑马.本文将从产品上全面剖析,阿里云RPA这款产品的现阶段情况,同时简单谈谈阿里云RPA的商业化进展. 阿 ...
- PHP ftp_rename() 函数
定义和用法 ftp_rename() 函数重命名 FTP 服务器上的文件或目录. 如果成功,该函数返回 TRUE.如果失败,则返回 FALSE. 语法 ftp_rename(ftp_connectio ...
- sqoop简介和原理分析
Sqoop简介 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql.postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL , ...
- 嘶吼CTF2019总结(Web部分题目复现以及部分杂项)
easy calc 这次的比赛自己一题都没有做出来,赛后看题解的时候很难受,其实有很多东西自己其实是可以做出来的,但是思路被限制了,可能这就是菜吧. 首先web题目就是一个easy calc,emmm ...