先看一段代码,如下

 #include<stdlib.h>
#include<stdio.h>
#define LEN 5
int main(int argc,char** argv){
int i;
float x=;
float arr[LEN];
#pragma offload target(mic) out(arr)
for(i=;i<LEN;i++){
arr[i]=i*3.0f/x;
}
if(fabs(arr[]-*3.0f/x)<1e-)
printf("Demo is right\n");
else
printf("Demo is wrong,arr[2] id %f\n",arr[]);
符合首页要求,会被工作人员移出首页,望理解。如有疑问,请联系contact@cnblogs.com。
网站分类

     return ;
}

out是出现的关键字,这个关键字的意思时告诉编译器,括号内的变量/数组是需要输出的。这样驱动就会自动的在代码离开离开MIC卡时,将变量内容拷贝到内存中的相应位置去。于此类似的还有,in,inout,nocopy关键字。

in:输入。在设备端开辟空间并将主机端数据复制到设备端。

out:输出。在设备端开辟空间,在进入设备端时将主机端数据复制到设备端,从设备端离开时,将数据从设备端复制到主机端。

nocopy:不拷贝,仅建立空间,不复制数据。

(1)传输关键字可以有零个或多个,当有多个时,可以连续书写,之间也可以用逗号或空格隔开。相同的传输关键字可以在一个offload语句中使用多次 ,但相同的变量名不可以在一个offload中出现啊多次(即使在不同关键字的参数中)。

(2)传输关键字后跟括号,括号内的参数是C/C++的变量名。

(3)变量应为数组名或指针(特指指向动态数组的指针)或普通变量(标量),多个变量之间用逗号隔开。

(4)变量为指针时,指针只能指向非指针变量,即不支持二维指针。

(5)变量为数组或指向数组的指针时,可以指定数组的起始和长度。

(6)变量为指针时,需要在变量名后加上“:length(len)”,不含引号,其中len为动态数组的元素个数,若多个动态数组元素个数相同,可写在一处,例如:in(a,b,c:length(20))。元素个数可以是变量。

(7)除了length以外,还有alloc_if,free_if,align,alloc,into等5个关键字,使用关键字之前也需要用冒号分隔(一个传输关键字可以用一个冒号即可)。

(8)alloc_if和free_if的参数时判断型表达式,其计算结果应是布尔型。如果alloc_if的参数结果为真则在进入设备端时为前述变量开辟空间,如果free_if的参数结果为真则在离开设备端时为前述变量释放空间(下有例子)。

(9)align的参数是一个正整数,其必须是2的整数次幂,其含义是:在设备端开辟的前述变量,以align参数的长度对齐。

(10)alloc的参数是变量或数组名,但只能一对一的传递,其含义是:将数组从主机端拷贝到设备端的另一个数组,或相反。into可以和alloc,alloc_if,free_if结合使用。但不能与inout,nocopy同时使用。

下面是一些代码片段

 //以下两行仅在设备端上开辟内存
#pragma offload target(mic) nocopy(P:length(sz) alloc_if(1) free_if(0))
{};
//nocopy:不需要从主机端拷贝数据,代码段退出时不从设备端拷贝回主机端
//p:(length(sz)): nocopy的是名为p的元素个数为sz(注意这里虽然关键字是length但不是数组长度,而是元素个数)的数组
//p: 必须在主机端事先声明,可以仅声明一个指针而不必开辟空间,因为如果不声明的话,MIC端无法得知p的类型
//alloc_if(1): 开辟内存
//free_if(0): 代码段(本offload)退出时不释放内存 //以下两行从主机端拷贝数据到设备端
#pragma offload in(p:length(sz) alloc_if(0) free_if(0))
{/*这里使用数组p进行运算*/}
//in: 从主机端拷贝数据到设备端
//因为p在上一个offload代码段已引用,且并没有释放内存,所以这里可以直接使用
//alloc_if(0): 不开辟内存。因为上段代码没有删除内存空间 //以下两行禁止任何改变p内存分配的操作
#pragma offload nocopy(p)
{/*这里使用p进行运算*/}
//没有显式指定,则不会有传入/传出/创建空间/删除空间的操作,且仅有这种用法时,无需指定数组长度 //以下两行将数据传出并释放内存
#pragma offload out(p:length(sz) alloc_if(0) free_if(1))
{/*这里使用p进行运算*/}
//out:退出时将数据从设备端拷贝到主机端
//alloc_if(0): 不创建内存空间(因为前面没有释放)
//free_if(1): 退出时释放空间

这其中有一种特殊情况,如果传输的指针是指向CPU上的静态变量的,且变量被__declspec(target(mic))声明,则alloc_if和free_if会被忽略。

对于in/out/inout语句来说,还有一个比较实用的语法,即传输数组的一部分。例如以下这段代码:

 typedef int ARRAY[][];
int a[][];
int* p;
ARRAY *p;
int *r[][];
int i,j;
struct {int y;} x;
#pragma offload... int(a)
#pragma offload... out(a[i:j][:])
#pragma offload... in(p[0:100])
#pragma offload... in((*p)[5][:])
#pragma offload... out(x,y)

in/out语句可以只引用数组的一部分,数组的维度用“[]”表示。第8行是最常用的,传输的是,数组a的全部数据。第9行传输数组a的一部分,其中[i:j]规范第1维,i表示该维的起始位置,j表示个数第2维中中括号内部只有冒号,省略了前后,表示第2维是完整的。即传输的内容是a [i][0]~a[i+j-1][499]。如本句所示,长度参数(i,j)可以是变量。第10行的意思是传输p指向的数组中,从0起始的100个元素,本句说明即使传输的是指向动态数组的指针,也可以用数组的“[]”形式。第11行中,第1维只有一个参数5,意为第1维只有一个元素,即本句中传输的int[5][0]~int[5][9](ARRAY是int[10][10]的同义词,q是指向int[10][10]的指针)。第12行表示可以传输结构体的一部分。

  以上方式可以让我们很方便的传输数组的一部分,在节省传输时间的同时也减少了对代码的改动。在使用时需要注意,虽然传输的是数组的一部分,但在MIC卡端开辟内存空间时,任然开辟了从第1个元素开始的全部空间,所以一方面这种写法并没有减少内存占用,另一方面使用时任然要将数组视为整体使用。即当无视offload语句的时候。或者说假设程序在CPU端运行时,代码如何书写,在传输部分数组时,代码应使用同样的写法,这是为了避免维护两套代码而设计的。例如:有一个数组p[100],当in(p[2:10])时,在MIC端使用时,会在MIC端开辟12个元素的空间(p[0]-p[11]) ,并从主机内存中拷贝p[2]-p[11]的数据到MIC端内存,所以第一个有效元素任然写作p[2],而不是p[0];

同时也有两个关键字是针对这种用法的,即alloc和into。

正如前文所述,传输数组一部分的语法,会开辟全部(至少是从第一个元素开始的)的内存空间,但有时并不需要开辟这么多的空间,于是可以用alloc语法,限定开辟空间的范围,,如:

#pragma offload... in(p[10:100]:alloc(p[5:1000]))

这条offload语句首先在设备端开辟了1个1000个元素的数组p,数组下标的可用范围从5开始,即5~10004.然后将主机端从p[10]开始的100个元素,即p[10]-p[109]传到设备端的p[10]-p[109]的位置。需要注意的是,检查数句越界的责任人在程序员。

into语句可以将主机数组的一部分传递给另一个设备数组,反之亦然。例如:

#pragma offload... in(p[0:500]:into(p1[500:500]))

这条offload语句会将主机端p[0]开始的500个元素的值,复制到设备端p1[500]-p1[999]的相应位置。

使用这种方式需要由程序员把控正确性,尤其是有覆盖的情况,如:

#pragma offload... in(p[0:600] into(p1[0:600])) \
in(p[:] : into(p1[:]))

这里的目的数组p1在两次传输中互相有重叠的地方,一个是0~599,另一个是100~499,两次传输在100~499的位置有重叠,这样会导致未定义的结果,即在同一个offload语句中,多个传输的顺序不一定。

要注意的是这里的into并不能简单的视作简单内存拷贝,因此不能在不同的维度的数组数组间传递数据,例如;

#ERROR!
int rank1[],rank2[][];
#pragma offload... out(rank1:into(rank2))

由于rank1和rank2维度不一致,因此不能直接传递。

MIC中的数据传输的更多相关文章

  1. GPRS GPRS(General Packet Radio Service)是通用分组无线服务技术的简称,它是GSM移动电话用户可用的一种移动数据业务,属于第二代移动通信中的数据传输技术

    GPRS 锁定 本词条由“科普中国”百科科学词条编写与应用工作项目 审核 . GPRS(General Packet Radio Service)是通用分组无线服务技术的简称,它是GSM移动电话用户可 ...

  2. MIC中offload语法总结

    MIC中offload的用法如下: #pragma offload specifier [,specifier...]specifier可以填入的选项为:target 例:taget(mic:0)if ...

  3. MIC中示例程序计算π

    mic中编程十分简单,只需在普通程序中简单加几句就可以,使用 lspci|grep -i -co-processor 命令可以查看机器中是否插入MIC卡以及MIC卡的数目,MIC编程环境的配置这里就不 ...

  4. Flink架构(二)- Flink中的数据传输

    2. Flink中的数据传输 在一个运行的application中,它的tasks在持续交换数据.TaskManager负责做数据传输.TaskManager的网络组件首先从缓冲buffer中收集re ...

  5. MIC中函数和变量的声明

    c++/c使用 __declspec(target(mic))函数或变量声明 或 __attribute__((target(mic)))函数或变量声明 举例如下: __attribute__((ta ...

  6. Struts2 中的数据传输

    1.     如何将参数从界面传递到Action? 你可以把Struts2中的Action看做是Struts1的Action+ActionForm,即只需在Action中定义相关的属性(要有gette ...

  7. Struts2 中的数据传输的几种方式

    1.     如何将参数从界面传递到Action? 你可以把Struts2中的Action看做是Struts1的Action+ActionForm,即只需在Action中定义相关的属性(要有gette ...

  8. Flink中的数据传输与背压

    一图道尽心酸: 大的原理,上游的task产生数据后,会写在本地的缓存中,然后通知JM自己的数据已经好了,JM通知下游的Task去拉取数据,下游的Task然后去上游的Task拉取数据,形成链条. 但是在 ...

  9. jquery中的数据传输

    <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"% ...

随机推荐

  1. 集合框架(06)Arrays

    Arrays Arrays:用于操作数组的工具类,里面都是静态方法 ---数组变集合 1.asList:将数组变成List集合 把数组变成list集合的好处?可以使用集合的思想和方法来操作数组中的元素 ...

  2. 一些 iOS 常用的第三方库

    网络通信 AFNetworking 轻量级的通讯类库,使用非常简单.建议更新到最新版,前几天看新闻说之前有个逻辑性的 bug https://github.com/AFNetworking/AFNet ...

  3. 【IntellJ IDEA】idea的Terminal窗口中文乱码 解决方法

    在操作git命令在windows上的idea中的terminal窗口时,总是出现中文乱码的问题 本开始以为是git乱码的问题,如果是GIt中文乱码,解决方案:https://www.cnblogs.c ...

  4. spring-data-jpa动态条件查询

    //获取动态条件的集合List<Long> list = new ArrayList<Long>(); Long sysUserId = currentUser.getSysU ...

  5. C# 下利用ICSharpCode.SharpZipLib.dll实现文件/目录压缩、解压缩

    ICSharpCode.SharpZipLib.dll下载地址 1.压缩某个指定文件夹下日志,将日志压缩到CompressionDirectory文件夹中,并清除原来未压缩日志. #region 压缩 ...

  6. linux文件传输

    Linux下几种文件传输命令 sz rz sftp scp 最近在部署系统时接触了一些文件传输命令,分别做一下简单记录: 1.sftp常用来在两台linux之间传输文件 Secure Ftp 是一个基 ...

  7. java中XML操作:xml与string互转、读取XML文档节点及对XML节点增删改查

    一.XML和String互转: 使用dom4j程式变得很简单 //字符串转XML String xmlStr = \"......\"; Document document = D ...

  8. 使用ffmpeg截取视频封面并批量上传

    需求:将视频文件压入zip包,然后上传服务器.服务器对zip解压,使用bat/shell,使用ffmpeg对视频进行封面截取.再使用OSS对视频和封面进行批量上传.最后将信息存入数据库 遇到的问题 1 ...

  9. StreamingContext、DStream、Receiver深度剖析

    本课分成四部分讲解,第一部分对StreamingContext功能及源码剖析:第二部分对DStream功能及源码剖析:第三部分对Receiver功能及源码剖析:最后一部分将StreamingConte ...

  10. wp8手机浏览器项目

    项目需求如下: 1.页面布局 最上方为搜索/网址框 中间为网页显示区,默认主页为百度搜索 最下方为功能栏,分别有后退,前进,窗口和更多功能 在更多功能中有 分享给好友 发送网址到桌面 查看历史记录等 ...