OpenCL 图像卷积 2

▶ 上一篇图像卷积 http://www.cnblogs.com/cuancuancuanhao/p/8535569.html。这篇使用了 OpenCV 从文件读取彩色的 jpeg 图像，进行边缘检测以后写回文件。

● 代码（没有使用局部内存优化）

 // convolution.cl，核函数，应该和上一篇中无优化内核是一样的

 __kernel void convolution(__read_only image2d_t sourceImage, __write_only image2d_t outputImage,

     int rows, int cols, __constant float* filter, int filterWidth, sampler_t sampler)

 {

     const int col = get_global_id(), row = get_global_id();   // 注意工作项的顺序，图像上是先横着数再竖着数

     const int halfWidth = (int)(filterWidth / );

     float4 sum = { 0.0f, 0.0f, 0.0f, 0.0f }, pixel;             // 输出数据类型是四元浮点数，与 image 统一

     int i, j, filterIdx;                                        // 传入的卷积窗口是一维的，用一个下标即可遍历

     int2 coords;

     for (filterIdx = , i = -halfWidth; i <= halfWidth; i++)

     {

         coords.y = row + i;                         // 从 work-item 分到的行号偏移 i 行，作为图像坐标的第二分量

         for (j = -halfWidth; j <= halfWidth; j++)

         {

             coords.x = col + j;                     // 从 work-item 分到的列号偏移 i 列，作为图像坐标的第一分量

             pixel = read_imagef(sourceImage, sampler, coords);  // 读取源图像上相应位置的值

             sum.x += pixel.x * filter[filterIdx++];

         }

     }

     if (row < rows && col < cols)                   // 将落在有效范围内的计算数据输出

     {

         coords.x = col;

         coords.y = row;

         write_imagef(outputImage, coords, sum);

     }

     return;

 }

 // convolution.c，主函数

 #include <stdio.h>

 #include <stdlib.h>

 #include <cl.h>

 #include <opencv.hpp>

 #include <D:\Program\OpenCV\build\include\opencv2\core\cvstd.hpp>// 不知道为什么要加这个，否则报错

 #include <iostream>

 #include <vector>

 using namespace std;

 using namespace cv;

 #define CUAN_OPENCL12

 #ifndef CUAN_OPENCL12

 #pragma warning(disable : 4996)// 部分函数在 OpenCL2.0 中已经被弃用，需要添加该行以支持老版本中的函数，否则报错，信息举例 "'clCreateImage2D': 被声明为已否决    "

 #endif

 const char *sourceProgram = "D:\\Code\\OpenCL\\convolution.cl";// 核函数文件

 char* readSource(const char* kernelPath)// 读取文本文件，存储为 char *

 {

     FILE *fp;

     char *source;

     long int size;

     printf("readSource, Program file: %s\n", kernelPath);

     fopen_s(&fp, kernelPath, "rb");

     if (!fp)

     {

         printf("Open kernel file failed\n");

         exit(-);

     }

     if (fseek(fp, , SEEK_END) != )

     {

         printf("Seek end of file faildd\n");

         exit(-);

     }

     if ((size = ftell(fp)) < )

     {

         printf("Get file position failed\n");

         exit(-);

     }

     rewind(fp);

     if ((source = (char *)malloc(size + )) == NULL)

     {

         printf("Allocate space failed\n");

         exit(-);

     }

     fread(source, , size, fp);

     fclose(fp);

     source[size] = '\0';

     return source;

 }

 int main()

 {

     // 卷积窗口相关

     const int filterWidth = , filterSize = filterWidth * filterWidth, halfFilterWidth = filterWidth / ;

     float filter[filterSize] =

     /*

     {// 恒等映射

         0, 0, 0, 0, 0,

         0, 0, 0, 0, 0,

         0, 0, 1, 0, 0,

         0, 0, 0, 0, 0,

         0, 0, 0, 0, 0

     };

     */

     {// 边缘检测

         -, ,-, , ,

          ,-, , , ,

         -, , , ,-,

          , , ,-, ,

          , ,-, ,-,

     };    

     // 图片相关

     Mat image = imread("D:\\1.jpg");

     Mat channel[];

     split(image, channel);

     int imageHeight = image.rows, imageWidth = image.cols;

     float *imageData = (float*)malloc(sizeof(float) * imageHeight * imageWidth);

     // 准备平台，设备，上下文，命令队列部分

     cl_int status;

     cl_platform_id platform;

     clGetPlatformIDs(, &platform, NULL);

     cl_device_id device;

     clGetDeviceIDs(platform, CL_DEVICE_TYPE_ALL, , &device, NULL);

     cl_context_properties props[] = { CL_CONTEXT_PLATFORM,(cl_context_properties)(platform),  };

     cl_context context;

     context = clCreateContext(props, , &device, NULL, NULL, &status);

     cl_command_queue queue;

     queue = clCreateCommandQueue(context, device, , &status);

     // 设置 image 数据描述符，仅使用 OpenCL1.2 规范

     cl_image_desc desc;

     desc.image_type = CL_MEM_OBJECT_IMAGE2D;

     desc.image_width = imageWidth;

     desc.image_height = imageHeight;

     desc.image_depth = ;

     desc.image_array_size = ;

     desc.image_row_pitch = ;

     desc.image_slice_pitch = ;

     desc.num_mip_levels = ;

     desc.num_samples = ;

     desc.buffer = NULL;

     cl_image_format format;

     format.image_channel_order = CL_R;

     format.image_channel_data_type = CL_FLOAT;

     cl_mem d_inputImage = clCreateImage(context, CL_MEM_READ_ONLY, &format, &desc, NULL, &status);

     cl_mem d_outputImage = clCreateImage(context, CL_MEM_WRITE_ONLY, &format, &desc, NULL, &status);

     // 卷积窗口缓冲区

     cl_mem d_filter = clCreateBuffer(context, , filterSize * sizeof(float), NULL, &status);

     // 主机数据写入设备

     size_t origin[] = { , ,  }, region[] = { imageWidth, imageHeight,  };// 偏移量和每个维度上的尺寸

     clEnqueueWriteBuffer(queue, d_filter, CL_TRUE, , filterSize * sizeof(float), filter, , NULL, NULL);

     // 创建采样器，规定图像坐标系的类型和访问越界时的解决方案，以及插值方式

     cl_sampler sampler = clCreateSampler(context, CL_FALSE, CL_ADDRESS_CLAMP_TO_EDGE, CL_FILTER_NEAREST, &status);

     // 程序的运行时编译，创建内核

     const char* source = readSource(sourceProgram);

     cl_program program = clCreateProgramWithSource(context, , &source, NULL, NULL);

     clBuildProgram(program, , &device, NULL, NULL, NULL);

     cl_kernel kernel = clCreateKernel(program, "convolution", &status);

     // 声明内核参数

     clSetKernelArg(kernel, , sizeof(cl_mem), &d_inputImage);

     clSetKernelArg(kernel, , sizeof(cl_mem), &d_outputImage);

     clSetKernelArg(kernel, , sizeof(int), &imageHeight);

     clSetKernelArg(kernel, , sizeof(int), &imageWidth);

     clSetKernelArg(kernel, , sizeof(cl_mem), &d_filter);

     clSetKernelArg(kernel, , sizeof(int), &filterWidth);

     clSetKernelArg(kernel, , sizeof(cl_sampler), &sampler);

     // 内核参数

     size_t globalSize[] = { imageWidth, imageHeight };

     int i, j;

     for (i = ; i < ; i++)// 三个通道，分别为蓝、绿、红

     {

         // 更新输入缓冲区

         for (j = ; j < imageHeight * imageWidth; j++)

             imageData[j] = (float)channel[i].data[j];

         clEnqueueWriteImage(queue, d_inputImage, CL_TRUE, origin, region, , , imageData, , NULL, NULL); 

         // 执行内核

         clEnqueueNDRangeKernel(queue, kernel, , NULL, globalSize, NULL, , NULL, NULL);

         // 向文件中写入结果

         clEnqueueReadImage(queue, d_outputImage, CL_TRUE, origin, region, , , imageData, , NULL, NULL);

         for (j = ; j < imageHeight * imageWidth; j++)

             channel[i].data[j] = (imageData[j] <  ?  : (unsigned char)int(imageData[j]));

     }

     merge(channel, , image);                                          // 三个通道合成

     imwrite("D:\\2.jpg", image, vector<int>{IMWRITE_JPEG_QUALITY, });// 最后一个参数为输出图片的选项，95%质量

     imshow("merge", image);                                            // 在窗口中展示图片

     waitKey();                                                        // 等待键盘输入    

     free(imageData);

     getchar();

     return ;

 }

● 输出结果，感谢助教提供的图，原图大小 1440 * 900

readSource, Program file: D:\Code\OpenCL\convolution.cl

● 用到 OpenCV 的关键部分

 #include <opencv.hpp>

 #include <D:\Program\OpenCV\build\include\opencv2\core\cvstd.hpp>// 不知道为什么要加这个，否则报错

 #include <iostream>

 #include <vector>

 {

     Mat image = imread("D:\\1.jpg");        // 读取图片，OpenCV 自动识别文件类型，返回一个 Mat 类

     Mat channel[];                         // 分别存放图像的三个通道

     split(image, channel);                  // 将原图像拆分为三个通道，分别为蓝色、绿色、红色

     int imageHeight = image.rows, imageWidth = image.cols;// 获取图像的行数和列数

     float value = (float)channel[].data[];        // 获取图像中某一像素的值，注意格式为 unsigned char，注意与 float 之间的转换

     channel[].data[] = (unsigned char)int(value); // float 转回 unsigned char，注意数据范围和四舍五入方向

     merge(channel, , image);                                          // 三个通道合成

     imwrite("D:\\2.jpg", image, vector<int>{IMWRITE_JPEG_QUALITY, });// 最后一个参数为输出图片的选项，95% 压缩质量

     imshow("merge", image);                                            // 在窗口中展示图片

     waitKey();                                                        // 等待键盘输入

 }

● 一个玄学错误：在使用图像写入函数 imwrite() 时报错

0x00007FFBB8A086C2 (opencv_world320.dll)处(位于 OpenCLProjectTemp.exe 中)引发的异常: 0xC0000005: 读取位置 0x000001DB4743F000 时发生访问冲突。

　　找了很多方法，大致有：

　　① 改文件途径，把路径从 "XX.jpg" 变成 "./XX.jpg" 或 ".\\XX.jpg"。无效，我用的绝对路径仍然会报错。

　　② OpenCV 不支持中文路径。我把输入和输出文件放到 "D:\\中文" 目录下，程序仍然能够正确执行。

　　③ 使用 release 模式而不是 debug 模式，仍然会出错。

　　④ 在调用函数 imwrite() 时显式规定第三个参数。这个我信了Orz，虽然该函数的原型中该参数有默认值 vector<int>{0}，但是不显式规定第三个参数的情况下一次都没有通过。可能还与我用的保存格式（jpg）有关，保存为 jpg、png 的时候可能必须规定该参数，而保存为 bmp 时没有改参数还是通过了。

　　⑤ 我之前觉得这个是内存泄漏了，因为该问题没有可重现性，直接用 .exe 执行程序会有以一定概率出错（注意动态库 opencv_world320.dll 的位置，拿不准环境变量的就放一份到 .exe 目录下）；在 VS 里 debug 时完全不改的代码仍有一定概率报错。

　　⑥ 关于 lib 的配置，这个解决了我的问题（不知道其他人是不是这样）。一开始配置属性 -> 链接器-> 输入 -> 附加依赖项的时候我用的是 opencv_world320.lib 而不是 opencv_world320d.lib，且运行程序用的是 debug 模式，所以会报错。其实这里 d 是 debug 的意思，opencv_world320.lib 是用于 release 模式的，opencv_world320d.lib 才是用于 debug 模式的，所以 ③ 说的是对的，应该使用与库相应的模式，不再有报错。

OpenCL 图像卷积 2的更多相关文章

OpenCL 图像卷积 3 使用 CPU
▶ CPU 图像卷积,共四种方法.分别为基本串行,使用模板,使用局部内存,使用AVX指令优化 ● 全部的代码,仅在主函数中选择调用的函数名即可. #include <stdio.h> #i ...
OpenCL 图像卷积 1
▶ 书上的代码改进而成,从文件读入一张 256 阶灰度图,按照给定的卷积窗口计算卷积,并输出到文件中. ● 代码,使用 9 格的均值窗口,居然硬读写 .bmp 文件,算是了解一下该文件的具体格式,留作 ...
图像卷积、相关以及在MATLAB中的操作
图像卷积.相关以及在MATLAB中的操作 2016年7月11日 20:34:35, By ChrisZZ 区分卷积和相关图像处理中常常需要用一个滤波器做空间滤波操作.空间滤波操作有时候也被叫做卷积滤 ...
SSE图像算法优化系列十一：使用FFT变换实现图像卷积。
本文重点主要不在于FFT的SSE优化,而在于使用FFT实现快速卷积的相关技巧和过程. 关于FFT变换,有很多参考的代码,特别是对于长度为2的整数次幂的序列,实现起来也是非常简易的,而对于非2次幂的序列 ...
zz图像卷积与滤波的一些知识点
Xinwei: 写的通俗易懂,终于让我这个不搞CV.不搞图像的外行理解卷积和滤波了. 图像卷积与滤波的一些知识点 zouxy09@qq.com http://blog.csdn.net/zouxy09 ...
对抗生成网络-图像卷积-mnist数据生成(代码) 1.tf.layers.conv2d(卷积操作) 2.tf.layers.conv2d_transpose(反卷积操作) 3.tf.layers.batch_normalize(归一化操作) 4.tf.maximum(用于lrelu) 5.tf.train_variable(训练中所有参数) 6.np.random.uniform(生成正态数据
1. tf.layers.conv2d(input, filter, kernel_size, stride, padding) # 进行卷积操作参数说明:input输入数据, filter特征图的 ...
UFLDL教程笔记及练习答案五（自编码线性解码器与处理大型图像**卷积与池化）
自己主动编码线性解码器自己主动编码线性解码器主要是考虑到稀疏自己主动编码器最后一层输出假设用sigmoid函数.因为稀疏自己主动编码器学习是的输出等于输入.simoid函数的值域在[0,1]之间,这 ...
TensorFlow实现图像卷积并可视化示例
图片尺寸要自己修改. 看起来好像没啥意思,不知道下一步能干什么,先卷了再说.由于weights是随机生成的(tf.random_normal作用:用于从服从指定正太分布的数值中取出随机数),所以每次卷 ...
opencv：图像卷积
卷积基本概念 C++代码实现卷积 #include <opencv2/opencv.hpp> #include <iostream> using namespace cv; u ...

随机推荐

FastJson/spring boot: json输出
1.引入FastJson依赖包  <dependency> <groupId>com.alibaba</groupId> ...
CentOS下安装docker,docker-compose
1.查看系统发行版本: lsb_release -a 2.安装docker:Docker 是一个开源的应用容器引擎,可以让开发者打包他们的应用以及依赖包到一个轻量级.可移植的容器中,然后发布到任何流行 ...
K-Means算法的收敛性和如何快速收敛超大的KMeans？
不多说,直接上干货! 面试很容易被问的:K-Means算法的收敛性. 在网上查阅了很多资料,并没有看到很清晰的解释,所以希望可以从K-Means与EM算法的关系,以及EM算法本身的收敛性证明中找到蛛丝 ...
js取整，保留小数位数、四舍五入、科学记数法及去掉数字末尾多余的0
1.向下取整 var num1 = 12.10345; var num2 =12.9801; var newnum1=Math.floor(num1) //结果 12 var newnum2= ...
rabbitmq之window环境启动
rabbitmq启动方式有2种 1.以应用方式启动 rabbitmq-server -detached 后台启动 Rabbitmq-server 直接启动,如果你关闭窗口或者需要在改窗口使用其他命令时 ...
Linux解压rar、zip、war、tar文件
在Linux上解压常见文件的命令: rar文件:rar e xxx.rar zip文件:unzip -xzvf xxx.zip war包:jar -xvf xxx.war tar包:tar -xzvf ...
基于zookeeper简单实现分布式锁
https://blog.csdn.net/desilting/article/details/41280869 这里利用zookeeper的EPHEMERAL_SEQUENTIAL类型节点及watc ...
1028：Ignatius and the Princess III
本题应该有两种方法: 1.母函数法 2.递推法母函数不了解,待充分了解之后,再进行补充! 这里为递推实现的方法: 思路: 定义:n为要拆分的整数: k为拆分的项数: f[n][k]代表 n的整数拆分 ...
（精华）将json数组和对象转换成List和Map(小龙哥和牛徳鹤的对话)
将java标准的数据结构ArrayList和HashMap转换成json对象和数组很简单只需要JSONArray.fromObject(obj);或者JSONObject.fromObject(ob ...
js中caller和callee属性详解
一.caller属性返回一个对函数的引用,该函数调用了当前函数.functionName.callerfunctionName 对象是所执行函数的名称.说明对于函数来说,caller 属性只有在函数执 ...

OpenCL 图像卷积 2

OpenCL 图像卷积 2的更多相关文章

随机推荐

热门专题