【查虫日志】快速判断一副灰度图像中是否只有黑色和白色值(即是否为二值图像)过程中bool变量的是是非非。
二值图像我们在图像处理过程中是经常遇到的,有的时候我们在进行一个算法处理前,需要判断下一副图像的数据是否符合二值图的需求,这个时候我们可以写个简单的函数来做个判断,比如我写了一个很简单的的代码如下:
bool IM_IsBinaryImage_C(unsigned char *Src, int Width, int Height, int Stride)
{
int Channel = Stride / Width;
if (Src == NULL) return false;
if ((Width <= ) || (Height <= )) return false;
if (Channel != ) return false;
for (int Y = ; Y < Height; Y++)
{
unsigned char *LinePS = Src + Y * Stride;
for (int X = ; X < Width * Channel; X++)
{
if ((LinePS[X] != ) && (LinePS[X] != )) return false;
//if (((LinePS[X] == 255) || (LinePS[X] == 0)) == false) return false;
}
}
return true;
}
即如果存在一个像素如果不为255,也不为0,则这副图就不是二值图,立即可以返回了,而无需进行后续的判断了。
当一副图不是二值图时,通常,我们很快就能返回结果了,那么最坏的情况就是他恰好是二值图,这样,我们就要遍历完所有的像素。我们测试过对于16MB的二值图(4000*4000),测试需要15ms的时间,为了能尽量减少耗时,可以使用如下的SIMD指令来优化这个判断:
bool IM_IsBinaryImage_SSE_Bug(unsigned char *Src, int Width, int Height, int Stride)
{
int Channel = Stride / Width;
if (Src == NULL) return false;
if ((Width <= ) || (Height <= )) return false;
if (Channel != ) return false;
int BlockSize = , Block = (Width * Channel)/ BlockSize; for (int Y = ; Y < Height; Y++) // 速度提升约16倍
{
unsigned char *LinePS = Src + Y * Stride;
for (int X = ; X < Block * BlockSize; X += BlockSize)
{
__m128i SrcV = _mm_loadu_si128((__m128i *)(LinePS + X));
__m128i MaskW = _mm_cmpeq_epi8(SrcV, _mm_set1_epi8());
__m128i MaskB = _mm_cmpeq_epi8(SrcV, _mm_setzero_si128());
__m128i Mask = _mm_or_si128(MaskW, MaskB);
if (_mm_movemask_epi8(Mask) != ) return false; // if (((LinePS[X] == 255) || (LinePS[X] == 0)) == false) return false;
}
for (int X = Block * BlockSize; X < Width * Channel; X++)
{
if ((LinePS[X] != ) && (LinePS[X] != )) return false;
}
}
return true;
}
由于SIMD指令里没有_mm_cmpneq_epi8函数,我们该用代码1片段里被注释掉的那种逻辑来判断一个像素是否是黑色和白色,这里当然也有一些技巧,比如_mm_movemask_epi8指令的运用。我们判断这个像素是否等于255和0,当然,一个像素不可能同时满足这两个条件,不满足的Mask返回0,满足则Mask返回255,所以如果他是黑色和白色,你们这两个Mask进行或操作肯定就为255,否则或操作后就为0,SIMD中这样的比较可以一次性进行16个像素,如果这16个像素都符合条件,那么或操作后的mask都为255,这样通过使用_mm_movemask_epi8来判断这个mask就完成了16个像素的判断。
很显然,这个过程的效率要高很多,测试16MB的真二值图,也就1ms就完成了判断。
好,我用上面的那个代码写成DLL,供C#调用,相关的函数声明如下:
[DllImport("IsBinaryImage.dll", CallingConvention = CallingConvention.StdCall, CharSet = CharSet.Unicode, ExactSpelling = true)]
private static extern bool IM_IsBinaryImage_C(byte* Src, int Width, int Height, int Stride);
[DllImport("IsBinaryImage.dll", CallingConvention = CallingConvention.StdCall, CharSet = CharSet.Unicode, ExactSpelling = true)]
private static extern bool IM_IsBinaryImage_SSE_Bug(byte* Src, int Width, int Height, int Stride);
可出来的结果令我非常诧异,我测试了下面这2幅图:
测试图1 测视图2 (页面压缩了)
这两幅图都不是二值图,他们在某些边缘位置都有抗锯齿操作。但是那个IM_IsBinaryImage_C检测图1不是二值图像,检测图2 是二值图像,而IM_IsBinaryImage_SSE_Bug则检测图1是二值图像,图2不是二值图像。开始我以为是我的SSE代码写错了,我就又换了一种写法,如下所示:
bool IM_IsBinaryImage_SSE(unsigned char *Src, int Width, int Height, int Stride)
{
int Channel = Stride / Width;
if (Src == NULL) return false;
if ((Width <= ) || (Height <= )) return false;
if (Channel != ) return false;
int BlockSize = , Block = (Width * Channel) / BlockSize;
bool Flag = true;
for (int Y = ; Y < Height; Y++) // 速度提升约16倍
{
unsigned char *LinePS = Src + Y * Stride;
if (Flag == false) break;
for (int X = ; X < Block * BlockSize; X += BlockSize)
{
__m128i SrcV = _mm_loadu_si128((__m128i *)(LinePS + X));
__m128i MaskW = _mm_cmpeq_epi8(SrcV, _mm_set1_epi8()); // _mm_cmpeq_epi8是自带的,如果使用_mm_cmpneq_epu8则慢了一些。
__m128i MaskB = _mm_cmpeq_epi8(SrcV, _mm_setzero_si128());
__m128i Mask = _mm_or_si128(MaskW, MaskB);
if (_mm_movemask_epi8(Mask) != )
{
Flag = false; // if ((LinePS[X] == 255) || (LinePS[X] == 0)) = false, return false
break;
}
}
for (int X = Block * BlockSize; X < Width * Channel; X++)
{
if ((LinePS[X] != ) && (LinePS[X] != ))
{
Flag = false;
break;
}
}
}
return Flag;
}
这个时候测绘对所有的图像结果都正确了。
但是,我觉得代码片段2应该是不会有任何错误的啊。为什么会出现这种现象呢。
后面从网上查了下,C++的bool变量就只有true和false, 是字节变量,这个可以用printf("%d", sizeof(false));来验证,会打印1。而在其他语言中,似乎是int类型。但是我在C#中用 MessageBox.Show(sizeof(bool).ToString()); 似乎也是弹出1。
但是,当我们把这些函数的返回值都改为int后,在C#中调用就正常了,比如:
int IM_IsBinaryImage_C(unsigned char *Src, int Width, int Height, int Stride)
也就是说上述的IM_IsBinaryImage_SSE_Bug函数体并无Bug。这到底是怎么回事,还请万能的网络高手有空予以解疑。
附上测试工程和代码:https://files.cnblogs.com/files/Imageshop/ISBinaryImage.rar
【查虫日志】快速判断一副灰度图像中是否只有黑色和白色值(即是否为二值图像)过程中bool变量的是是非非。的更多相关文章
- 我试了试用 SQL查 Linux日志,好用到飞起
大家好,我是小富~ 最近发现点好玩的工具,迫不及待的想跟大家分享一下. 大家平时都怎么查Linux日志呢? 像我平时会用tail.head.cat.sed.more.less这些经典系统命令,或者aw ...
- 快速判断ie10及以上版本浏览器
if (!(/msie [6|7|8|9]/i.test(navigator.userAgent))){ //ie10以上 }; 快速判断ie10及以上版本浏览器
- PHP取二进制文件头快速判断文件类型
<?php /*文件扩展名说明 *7173 gif *255216 jpg *13780 png *6677 bmp *239187 txt,aspx,asp,sql *208207 xls.d ...
- JavaScript正则表达式快速判断技巧
这里是JS的正则的一点心得,并不是最完整的规则汇总,更侧重实际运用中的快速判断,初学者接触正则之后往往会被一堆星号括号给弄晕,有了一些速判技巧就能从整体上把握从而不慌乱. JS正则快速判断技巧的核心就 ...
- 腾讯面试题 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中? 这个题目已经有一段时间了,但是腾讯现在还在用来面试.腾讯第一次面 ...
- 利用linq快速判断给定数字是否包含在某个段范围内
一.需求: 知道某段范围0x0020~0x007F0x00A0~0x017F0x01A0~0x01CF0x01F0~0x01FF0x0210~0x021F0x1EA0~0x1EFF给定一个值,快速判断 ...
- zoj 月赛B题(快速判断一个大数是否为素数)
给出一个64位的大数,如何快速判断其是否为素数 #include<algorithm> #include<cstdio> #include<cstring> #in ...
- vuex中filter的使用 && 快速判断一个数是否在一个数组中
vue中filter的使用 computed: mapState({ items: state => state.items.filter(function (value, index, arr ...
- 布隆过滤器 - 如何在100个亿URL中快速判断某URL是否存在?
题目描述 一个网站有 100 亿 url 存在一个黑名单中,每条 url 平均 64 字节.这个黑名单要怎么存?若此时随便输入一个 url,你如何快速判断该 url 是否在这个黑名单中? 题目解析 这 ...
随机推荐
- Spring中的Interceptor 拦截器 专题
spring-webmvc-4.3.14.RELEASE.jar org.springframework.web.servlet.DispatcherServlet#doDispatch /** * ...
- JavaScript严谨模式(Strict Mode)提升开发效率和质量
http://flandycheng.blog.51cto.com/855176/982719 http://my.oschina.net/Jsiwa/blog/272761
- gdal1.10编译经验
作者:朱金灿 来源:http://blog.csdn.net/clever101 集成了一些扩展库,使用makefile编译,出现了一个链接错误: libcmt.lib(crt0.obj): erro ...
- WPF 曲线图表控件(自制)(二)
原文:WPF 曲线图表控件(自制)(二) 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/koloumi/article/details/775218 ...
- mybatis如何实现分页功能?
1)原始方法,使用limit,需要自己处理分页逻辑: 对于mysql数据库可以使用limit,如: select * from table limit 5,10; --返回6-15行 对于oracle ...
- std::string 简单入门
string的定义原型 typedef basic_string<char, char_traits<char>, allocator<char> > string ...
- ZOJ 2334 HDU 1512 Monkey King
题意: 猴子们打架 认识的猴子不会打架 两仅仅猴子打完以后就认识了 A认识B B认识C A也认识C 每次打架由两伙猴子进行 分别选出自己的最高战斗力 在战斗之后两仅仅猴子战斗力减半 给出 ...
- WPF中StringFormat的用法--显示特定位数的数字
原文:WPF中StringFormat的用法--显示特定位数的数字 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/huangli321456/art ...
- .net元数据
概要 现在,在.net开发平台计划,其组成编译:IL代码.资源.程序集清单和类型元数据.我们知道,IL代码就是我们编写的代码.资源就是图片文件.xml文件,及其它文件,只有不清楚的是元数据(在这里将程 ...
- CentOS6.8环境安装oracle 11G
本节所讲内容: oracle11g基础环境配置 数据库的三种安装方式(图形.静默.克隆) http://db-engines.com REDHAT6.5安装oracle11.2.4 ORACLE11G ...