CSharpGL(24)用ComputeShader实现一个简单的图像边缘检测功能

效果图

这是红宝书里的例子，在这个例子中，下述功能全部登场，因此这个例子可作为使用Compute Shader的典型示例。

★用imageLoad从纹理中读取数据。★

★用imageStore将数据写入纹理。★

★用vertex/fragment shader显示出compute shader的计算结果。★

下面是3个测试用例。

下载

CSharpGL已在GitHub开源，欢迎对OpenGL有兴趣的同学加入（https://github.com/bitzhuwei/CSharpGL）

Image Processing

渲染结果

先解决简单的问题：把compute shader计算后的结果（一个纹理）显示出来。这用到如下的vertex shader和fragment shader，非常简单。

 #version  core

 in vec3 vert;

 in vec2 uv;

 out vec2 passUV;

 uniform mat4 mvp;

 void main(void)

 {

     gl_Position = mvp * vec4(vert, 1.0f);

     passUV = uv;

 }

vertex shader

 #version  core

 layout (location = ) out vec4 color;

 in vec2 passUV;

 layout (binding = ) uniform sampler2D output_image;

 void main(void)

 {

     color = texture(output_image, passUV);

 }

fragment shader

其模型用一个四边形即可。

边缘检测算法

理论

在一个图像上，什么是边缘？如果相邻的两个像素颜色差别很大，就可以算是边缘。差别越大，就越能被视作边缘。

这个例子实现了一个简单的边缘检测算法，使用一个边缘检测滤波器对输入的图像（作为纹理）进行卷积操作。这个例子中的滤波器是可分离的（separable filter），就是说，可以对多维度空间的各个维度都单独处理。这里，我们将它应用到2维图像上，首先对水平维度进行处理，然后对垂直维度进行处理。

为了实现这个算法，compute shader的每个请求都要处理输入图像的一个像素。它需要读取输入图像的内容，然后减去该像素旁边的采样值。这意味着一个请求要从输入图像中读取2次。

为避免多于的内存访问，这里用一个shared数组来存储输入图形的一行。我们在每个请求中读取输入图像的目标像素，然后存储到shared数组。当所有请求都读取输入图像后，这个shared数组就含有输入图像当前行的所有像素值。之后每个请求都可以直接从此shared数组中读取像素值，这个读取速度是非常快的。

Compute Shader

实现边缘检测算法的compute shader如下。

 #version  core

 // 最大支持宽度为512的图像

 layout (local_size_x = , local_size_y = , local_size_z = ) in;

 // 要进行检测的图像

 layout (rgba32f, binding = ) uniform image2D input_image;

 // 检测结果

 layout (rgba32f, binding = ) uniform image2D output_image;

 // 共享数组，存储当前行的像素

 shared vec4 scanline[];

 void main(void)

 {

     // 请求的位置

     ivec2 pos = ivec2(gl_GlobalInvocationID.xy);

     // 读取当前位置的像素

     scanline[pos.x] = imageLoad(input_image, pos);

     // 等待所有请求都走到这里

     barrier();

     // 计算边缘值，存储到output_image

     vec4 result = scanline[min(pos.x + , )] - scanline[max(pos.x - , )];

     // pos.yx：把输出图像翻转，这样就可以使用同一compute shader进行2维卷积。

     imageStore(output_image, pos.yx, result);

 }

执行

可以看到，上面的compute shader的一个local work group只能处理图像的一个维度上的一行。这一点由这一行代码决定：

layout (local_size_x = , local_size_y = , local_size_z = ) in;

为了处理此维度上的全部行，在调用此compute shader时要这样：

GL.GetDelegateFor<GL.glDispatchCompute>()(, , );

即指定在Y轴上执行512个local work group。这样就完成了在X轴维度上的计算。这时我们得到了一个中间图像intermediate_image。

★从这里可以看到设定local work group和global work group的理由：shader里的local_size_*大小有限，借助glDispatchCompute才能实现更大规模的计算，且更灵活。★

然后要对这个intermediate_image的Y轴维度执行算法。这时你注意到，在上面的compute shader里，我们用

imageStore(output_image, pos.yx, result);

而不是

imageStore(output_image, pos.xy, result);

这是把原图翻转了一下。因此，如果继续对intermediate_image执行上面的compute shader，实际上就实现了对原图在第二个维度上执行此算法。

因此总的计算过程如下。

 computeProgram.Bind();

 glBindImageTexture(, input_image[], , false, , GL.GL_READ_WRITE, GL.GL_RGBA32F);

 glBindImageTexture(, intermediate_image[], , false, , GL.GL_READ_WRITE, GL.GL_RGBA32F);

 // 在X轴上执行边缘检测算法

 glDispatchCompute(, , );

 // 确保所有compute shader请求都执行完成

 glMemoryBarrier(GL.GL_SHADER_IMAGE_ACCESS_BARRIER_BIT);

 glBindImageTexture(, intermediate_image[], , false, , GL.GL_READ_WRITE, GL.GL_RGBA32F);

 glBindImageTexture(, output_image[], , false, , GL.GL_READ_WRITE, GL.GL_RGBA32F);

 // 在Y轴上执行边缘检测算法

 glDispatchCompute(, , );

 glMemoryBarrier(GL.GL_SHADER_IMAGE_ACCESS_BARRIER_BIT);

总结

经过这个例子，开始正视创建纹理过程中的各项参数。

原CSharpGL的其他功能（3ds解析器、TTF2Bmp、CSSL等），我将逐步加入新CSharpGL。

欢迎对OpenGL有兴趣的同学关注（https://github.com/bitzhuwei/CSharpGL）

CSharpGL(24)用ComputeShader实现一个简单的图像边缘检测功能的更多相关文章

CSharpGL(23)用ComputeShader实现一个简单的ParticleSimulator
CSharpGL(23)用ComputeShader实现一个简单的ParticleSimulator 我还没有用过Compute Shader,所以现在把红宝书里的例子拿来了,加入CSharpGL中. ...
完成一段简单的Python程序，用于实现一个简单的加减乘除计算器功能
#!/bin/usr/env python#coding=utf-8'''完成一段简单的Python程序,用于实现一个简单的加减乘除计算器功能'''try: a=int(raw_input(" ...
基于PHP实现一个简单的在线聊天功能（轮询ajax ）
基于PHP实现一个简单的在线聊天功能(轮询ajax ) 一.总结 1.用的轮询ajax 二.基于PHP实现一个简单的在线聊天功能一直很想试着做一做这个有意思的功能,感觉复杂的不是数据交互和表结构,麻 ...
使用 jquery 的上传文件插件 uploadify 3.1 配合 java 来做一个简单的文件上次功能。并且在界面上有radio 的选择内容也要上传
使用 jquery 的上传文件插件 uploadify 3.1 配合 java 来做一个简单的文件上次功能.并且在界面上有radio 的选择内容也要上传 uploadify 插件的下载和文档地址 ...
数字集成电路设计-8-一个简单sobel图像边缘检测加速器的设计，实现，仿真与综合
引言图像视频处理等多媒体领域是FPGA应用的最主要的方面之一,边缘检测是图像处理和计算机视觉中的基本问题,所以也是最常用的,随着数据量的不断增加以及对实时性的要求,一般软件已经不能满足实际需要,这时 ...
EasilyUI的一个简单的拖拽功能
<%@ Page Language="C#" AutoEventWireup="true" CodeFile="Main.aspx.cs&quo ...
通过WebSocket实现一个简单的聊天室功能
WebSocket WebSocket是一个协议,它是是基于TCP的一种新的网络协议,TCP协议是一种持续性的协议,和HTTP不同的是,它可以在服务器端主动向客户端推送消息.通过这个协议,可以在建立一 ...
jQuery照片伸缩效应，这不是一个简单的图像缩放，它不影响其它元素的布局
之前在网上看到这样的效果,但我没有收藏夹网址,后来被我不知道如何来实现这种效果. 如今,互联网已收集有关专门.真是功夫不负有心人,被我发现. 我也努力过自己尝试着写: 但仅仅是单纯的图片放大.并且还影 ...
JavaScript实现一个简单的密码输入功能
常见的密码输入框当输入字符后会被替换成‘*’,而且旁边会有个小眼睛可以查看原本的字符,虽然input标签有这个功能,但这只是自己正在看正则表达式的时候突然想到的,就当做个练习,自己手动实现下: < ...

随机推荐

Apache执行Python脚本
由于经常需要到服务器上执行些命令,有些命令懒得敲,就准备写点脚本直接浏览器调用就好了,比如这样: 因为线上有现成的Apache,就直接放它里面了,当然访问安全要设置,我似乎别的随笔里写了安全问题,这里 ...
Entity Framework Core 1.1 升级通告
原文地址:https://blogs.msdn.microsoft.com/dotnet/2016/11/16/announcing-entity-framework-core-1-1/ 翻译:杨晓东 ...
Gradle配置APK自动签名完整流程
转载请注明出处:http://www.cnblogs.com/LT5505/p/6256683.html 一.生成签名 1.命令行生成签名,输入命令keytool -genkey -v -keysto ...
一道返回num值的小题目
题目描述: 实现fizzBuzz函数,参数num与返回值的关系如下: .如果num能同时被3和5整除,返回字符串fizzbuzz .如果num能被3整除,返回字符串fizz .如果num能被5整除,返 ...
谈谈一些有趣的CSS题目（一）-- 左边竖条的实现方法
开本系列,讨论一些有趣的 CSS 题目,抛开实用性而言,一些题目为了拓宽一下解决问题的思路,此外,涉及一些容易忽视的 CSS 细节. 解题不考虑兼容性,题目天马行空,想到什么说什么,如果解题中有你感觉 ...
History API与浏览器历史堆栈管理
移动端开发在某些场景中有着特殊需求,如为了提高用户体验和加快响应速度,常常在部分工程采用SPA架构.传统的单页应用基于url的hash值进行路由,这种实现不存在兼容性问题,但是缺点也有--针对不支持o ...
Web安全相关（四）：过多发布(Over Posting)
简介过多发布的内容相对比较简单,因此,我只打算把原文中的一些关键信息翻译一下.原文链接如下: http://www.asp.net/mvc/overview/getting-started/gett ...
js数组学习整理
原文地址:js数组学习整理常用的js数组操作方法及原理 1.声明数组的方式 var colors = new Array();//空的数组 var colors = new Array(3); // ...
使用EF CodeFirst 创建数据库
EntityFramework 在VS2015添加新建项时,选择数据->ADO.NET 实体数据模型,有一下选项来自数据库的EF设计器,这个就是我们最常用的EntityFramework设计模 ...
JavaScript求两个数字之间所有数字的和
这是在fcc上的中级算法中的第一题,拉出来的原因并不是因为有什么好说的,而是我刚看时以为是求两个数字的和, 很显然错了.我感觉自己的文字理解能力被严重鄙视了- -.故拉出来折腾折腾. 要求: 给你一个 ...

CSharpGL(24)用ComputeShader实现一个简单的图像边缘检测功能

效果图

下载