▶ 按书上写的管道的代码,需要使用 OpenCL2.0 的平台和设备,目前编译不通过,暂时不知道是什么问题,先把代码堆上来,以后换了新的设备再说

● 程序主要功能:用主机上的数组 srcHost 创建设备缓冲区 src,调用核函数 pipeProducer 将 src 分装到管道中,再调用核函数 pipeConsumer 将管道中的数据读到设备缓冲区 dst 中,最后拷贝回主机数组 dstHost 中检查结果。

● 代码

 //pipe.cl
__kernel void pipeProducer(__global float *src, __write_only pipe float outPipe)
{
int gid = get_global_id();
float srcPipe = src[gid];
reserve_id_t resID = reserve_write_pipe(outPipe, );
if (is_valid_reserve_id(resID))
{
if (write_pipe(outPipe, resID, , &srcPipe) != )
return;
commit_write_pipe(outPipe, resID);
}
} __kernel void pipeConsumer(__global float *dst, __read_only pipe float inPipe)
{
int gid = get_global_id();
float dstPipe;
reserve_id_t resID = reserve_read_pipe(inPipe, );
if (is_valid_reserve_id(resID))
{
if (read_pipe(inPipe, resID, , &dstPipe) != )
return;
commit_read_pipe(inPipe, resID);
}
dst[gid] = dstPipe;
}
 //main.c
#include <stdio.h>
#include <stdlib.h>
#include <cl.h> const char *sourceCode = "D:/Code/pipe.cl"; char* readSource(const char* kernelPath)// 读取文本文件,存储为 char *
{
FILE *fp;
char *source;
long int size;
//printf("readSource, Program file: %s\n", kernelPath);
fopen_s(&fp, kernelPath, "rb");
if (!fp)
{
printf("Open kernel file failed\n");
exit(-);
}
if (fseek(fp, , SEEK_END) != )
{
printf("Seek end of file faildd\n");
exit(-);
}
if ((size = ftell(fp)) < )
{
printf("Get file position failed\n");
exit(-);
}
rewind(fp);
if ((source = (char *)malloc(size + )) == NULL)
{
printf("Allocate space failed\n");
exit(-);
}
fread(source, , size, fp);
fclose(fp);
source[size] = '\0';
return source;
} int main()
{
const int nPacket = , dataSize = nPacket * sizeof(float);
char info[] = { };
int i; // 初始化平台
cl_int status;
cl_platform_id platform;
clGetPlatformIDs(, &platform, NULL);
cl_device_id device;
clGetDeviceIDs(platform, CL_DEVICE_TYPE_GPU, , &device, NULL);
cl_context_properties contextProp[] = { CL_CONTEXT_PLATFORM,(cl_context_properties)(platform), };
cl_context context = clCreateContext(contextProp, , &device, NULL, contextProp, &status);
cl_command_queue queue = clCreateCommandQueueWithProperties(context, device, NULL, &status);
cl_event eventProducer, eventConsumer; const char* source = readSource(sourceCode);
cl_program program = clCreateProgramWithSource(context, , &source, NULL, &status);
status = clBuildProgram(program, , &device, "-w -g –cl-std=CL2.0", NULL, NULL); clGetProgramBuildInfo(program, device, CL_PROGRAM_BUILD_LOG, , info, NULL);
printf("Build log:\n%s\n", info); cl_kernel kernelProducer = clCreateKernel(program, "pipeProducer", &status);
cl_kernel kernelConsumer = clCreateKernel(program, "pipeConsumer", &status);
size_t globalSize = nPacket, localSize = ; float *srcHost = (float *)malloc(dataSize);
float *dstHost = (float *)malloc(dataSize);
for (i = ; i < nPacket; srcHost[i] = i, dstHost[i] = 0.0f, i++); cl_mem src, dst;
src = clCreateBuffer(context, CL_MEM_READ_ONLY|CL_MEM_COPY_HOST_PTR, dataSize, srcHost, &status);
dst = clCreateBuffer(context, CL_MEM_WRITE_ONLY, dataSize, NULL, &status); cl_mem pipe = clCreatePipe(context, CL_MEM_HOST_NO_ACCESS, sizeof(float), nPacket, NULL, &status); clSetKernelArg(kernelProducer, , sizeof(cl_mem),src);
clSetKernelArg(kernelProducer, , sizeof(cl_mem), &pipe); clSetKernelArg(kernelProducer, , sizeof(cl_mem), dst);
clSetKernelArg(kernelProducer, , sizeof(cl_mem), &pipe); clEnqueueNDRangeKernel(queue, kernelProducer, , NULL, &globalSize, &localSize, , NULL, &eventProducer);
clEnqueueNDRangeKernel(queue, kernelConsumer, , NULL, &globalSize, &localSize, , &eventProducer, &eventConsumer);
clEnqueueReadBuffer(queue, dst, CL_TRUE, dataSize, dataSize, dstHost, , &eventConsumer, NULL);
clFinish(queue); for (i = ; i < nPacket; i++)
{
if (dstHost[i] != i)
break;
}
printf("Output is %s.\n", (i == nPacket) ? "correct" : "incorrect"); free(srcHost);
free(dstHost);
clReleaseContext(context);
clReleaseCommandQueue(queue);
clReleaseProgram(program);
clReleaseKernel(kernelProducer);
clReleaseKernel(kernelConsumer);
getchar();
return ;
}

● 输出结果

■ 使用编译参数 "-w -g –cl-std=CL2.0" 时返回 status 为 -43(CL_INVALID_BUILD_OPTIONS),不使用参数 "–cl-std=CL2.0" 的情况下返回 -11(CL_BUILD_PROGRAM_FAILURE),麻烦的是调用函数 clGetProgramBuildInfo 查询编译日志 info 始终都是空的,不知道出了什么问题。

■ 转机,去掉了修饰符 __write_only 和 __read_only(只用于图像类型的缓冲区),返回 status 为 -11,至少报错信息有了:【identifier "pipe" is undefined】和【invalid combination of type specifiers】(指在 float 上)

● 后续代码,但是上述代码都编译不了,下面的也暂时没用。(1)使用局部内存来统一工作组的写入

 //pipe2.cl
__kernel void pipeProducer(__global float *src, __write_only pipe float outPipe)
{
int gid = get_global_id(), lid = get_local_id();
__local reserve_id_t resID;
if (lid == )
resID = reserve_write_pipe(outPipe, get_local_size()); // 工作组中首个工作项一次预定多个管道位置
barrier(CLK_LOCAL_MEM_FENCE); float srcPipe = src[id];
if (is_valid_reserve_id(resID))
{
if (write_pipe(outPipe, resID, lid, &srcPipe) != ) // 每个工作项写入预定的位置
return;
commit_write_pipe(outPipe, resID);
}
} __kernel void pipeConsumer(__global float *dst, __read_only pipe float inPipe)
{
int gid = get_global_id(), lid = get_local_id();
__local reserve_id_t resID;
if (lid == )
resID = reserve_read_pipe(inPipe, get_local_size());
barrier(CLK_LOCAL_MEM_FENCE); float dstPipe;
if (is_valid_reserve_id(resID))
{
if (read_pipe(inPipe, resID, lid, &dstPipe) != )
return;
commit_read_pipe(inPipe, resID);
}
dst[gid] = dstPipe;
}

● (2)使用工作组管道操作简化上述代码(只是干掉了一个 if 和一个同步)

 //pipe3.cl
__kernel void pipeProducer(__global float *src, __write_only pipe float outPipe)
{
int gid = get_global_id(), lid = get_local_id();
__local reserve_id_t resID = work_group_reserve_write_pipe(outPipe, get_local_size());// 自带分支和同步 float srcPipe = src[id];
if (is_valid_reserve_id(resID))
{
if (write_pipe(outPipe, resID, lid, &srcPipe) != )
return;
commit_write_pipe(outPipe, resID);
}
} __kernel void pipeConsumer(__global float *dst, __read_only pipe float inPipe)
{
int gid = get_global_id(), lid = get_local_id();
__local reserve_id_t resID = work_group_reserve_read_pipe(inPipe, get_local_size()); float dstPipe;
if (is_valid_reserve_id(resID))
{
if (read_pipe(inPipe, resID, lid, &dstPipe) != )
return;
commit_read_pipe(inPipe, resID);
}
dst[gid] = dstPipe;
}

● 书上原本的主函数的内容(关于数据缓冲区的部分),是用虚拟内存写的,由于办公室的电脑不支持,上面的代码中被我换成了普通缓冲区

     float *src = (float *)clSVMAlloc(context, CL_MEM_READ_WRITE | CL_MEM_SVM_FINE_GRAIN_BUFFER, dataSize, );
float *dst = (float *)clSVMAlloc(context, CL_MEM_READ_WRITE | CL_MEM_SVM_FINE_GRAIN_BUFFER, dataSize, );
if (src == NULL || dst == NULL)
{
printf("clSVMAlloc failed!\n");
getchar();
return ;
} clEnqueueSVMMap(queue, CL_TRUE, CL_MAP_WRITE, src, dataSize, , NULL, NULL);
for (i = ; i < nPacket; i++)
src[i] = i, dst[i] = 0.0f;
clEnqueueSVMUnmap(queue, src, , NULL, NULL); cl_mem pipe = clCreatePipe(context, CL_MEM_HOST_NO_ACCESS, sizeof(float), nPacket, NULL, &status); clSetKernelArgSVMPointer(kernelProducer, , src);
clSetKernelArg(kernelProducer, , sizeof(cl_mem), &pipe); clSetKernelArgSVMPointer(kernelProducer, , dst);
clSetKernelArg(kernelProducer, , sizeof(cl_mem), &pipe); clEnqueueNDRangeKernel(queue, kernelProducer, , NULL, &globalSize, &localSize, , NULL, &eventProducer);
clEnqueueNDRangeKernel(queue, kernelConsumer, , NULL, &globalSize, &localSize, , &eventProducer,NULL);
clFinish(queue); clEnqueueSVMMap(queue, CL_TRUE, CL_MAP_READ, dst, dataSize, , NULL, NULL);
for (i = ; i < nPacket; i++)
{
if (dst[i] != i)
break;
}
printf("Output is %s.\n", (i == nPacket) ? "correct" : "incorrect");
clEnqueueSVMUnmap(queue, dst, , NULL, NULL);

OpenCL 管道的更多相关文章

  1. 通过 Autostereograms 案例学习 OpenGL 和 OpenCL 的互操作性

    引言 在过去的十年里, GPU (图形处理单元)已经从特殊硬件(特供)转变成能够在数值计算领域开辟新篇章的高性能计算机设备. 很多算法能够使用拥有巨大的处理能力的GPU来快速运行和处理大数据量.即使在 ...

  2. [译]Vulkan教程(13)图形管道基础之Shader模块

    [译]Vulkan教程(13)图形管道基础之Shader模块 Shader modules Unlike earlier APIs, shader code in Vulkan has to be s ...

  3. OpenCL Kernel设计优化

    使用Intel® FPGA SDK for OpenCL™ 离线编译器,不需要调整kernel代码便可以将其最佳的适应于固定的硬件设备,而是离线编译器会根据kernel的要求自适应调整硬件的结构. 通 ...

  4. ASP.NET Core HTTP 管道中的那些事儿

    前言 马上2016年就要过去了,时间可是真快啊. 上次写完 Identity 系列之后,反响还不错,所以本来打算写一个 ASP.NET Core 中间件系列的,但是中间遇到了很多事情.首先是 NPOI ...

  5. .NET Core中间件的注册和管道的构建(3) ---- 使用Map/MapWhen扩展方法

    .NET Core中间件的注册和管道的构建(3) ---- 使用Map/MapWhen扩展方法 0x00 为什么需要Map(MapWhen)扩展 如果业务逻辑比较简单的话,一条主管道就够了,确实用不到 ...

  6. .NET Core中间件的注册和管道的构建(2)---- 用UseMiddleware扩展方法注册中间件类

    .NET Core中间件的注册和管道的构建(2)---- 用UseMiddleware扩展方法注册中间件类 0x00 为什么要引入扩展方法 有的中间件功能比较简单,有的则比较复杂,并且依赖其它组件.除 ...

  7. .NET Core中间件的注册和管道的构建(1)---- 注册和构建原理

    .NET Core中间件的注册和管道的构建(1)---- 注册和构建原理 0x00 问题的产生 管道是.NET Core中非常关键的一个概念,很多重要的组件都以中间件的形式存在,包括权限管理.会话管理 ...

  8. 【翻译】MongoDB指南/聚合——聚合管道

    [原文地址]https://docs.mongodb.com/manual/ 聚合 聚合操作处理数据记录并返回计算后的结果.聚合操作将多个文档分组,并能对已分组的数据执行一系列操作而返回单一结果.Mo ...

  9. 学习ASP.NET Core, 怎能不了解请求处理管道[6]: 管道是如何随着WebHost的开启被构建出来的?

    注册的服务器和中间件共同构成了ASP.NET Core用于处理请求的管道, 这样一个管道是在我们启动作为应用宿主的WebHost时构建出来的.要深刻了解这个管道是如何被构建出来的,我们就必须对WebH ...

随机推荐

  1. 字符串哈希算法(以ELFHash详解)

    更多字符串哈希算法请参考:http://blog.csdn.net/AlburtHoffman/article/details/19641123 先来了解一下何为哈希: 哈希表是根据设定的哈希函数H( ...

  2. FSTConfiguration 高性能序列化框架FST

    转自:https://blog.csdn.net/z69183787/article/details/53005961 fst是完全兼容JDK序列化协议的系列化框架,序列化速度大概是JDK的4-10倍 ...

  3. 使用Visual Studio Code开发Asp.Net Core WebApi学习笔记(三)-- Logger

    本篇是在上一篇的基础上添加日志功能,并记录NLog在Asp.Net Core里的使用方法. 第一部分:默认Logger支持 一.project.json添加日志包引用,并在cmd窗口使用 dotnet ...

  4. streamsets 集成 cratedb 测试

    我们可以集成crate 到streamsets 中可以实现强大的数据导入,数据分析能力. 演示的是进行csv 文件的解析并输出到cratedb 环境使用docker && docker ...

  5. Jmeter参数跨线程组传递

    1.利用BeanShell, 请求==>后置==>beanshellpostprocessorScripts内写:props.put("user_name"," ...

  6. 浏览器的自动翻译会影响 JS 逻辑

    有人在 QQ 群里反馈,官方注册后跳转时出现 Bug. 收到群友非常有用的资讯,这是因为浏览器的自动翻译功能引起的. 11:04:21[潜水]Better Command 2017/12/30 11: ...

  7. zz 史上最全--各银行借记卡的年费、小额管理费、转账费等!

    史上最全--各银行借记卡的年费.小额管理费.转账费等! 发布时间:2015-01-14 17:28:10 还在迷茫借记卡自费的菜主儿们~菜菜特别整理关于各银行借记卡.存折账户等的年费.小额管理费.转账 ...

  8. install kde in ubuntu

    http://www.arthurtoday.com/2012/08/ubuntu-12.04-install-kde-4.9.html sudo apt-get install kubuntu-de ...

  9. SQL语言:DDL/DML/DQL/DCL

    SQL (Structure Query Language)语言是数据库的核心语言. SQL 的发展是从1974年开始的,其发展过程如下: 1974年-----由Boyce和Chamberlin提出, ...

  10. mac下hbase安装

    出处:https://www.jianshu.com/p/510e1d599123 安装到的路径:/usr/local/Cellar/hbase/1.2.6 linux操作: linux命令 作用 . ...