本系列文章由 @yhl_leo 出品,转载请注明出处。

文章链接: http://blog.csdn.net/yhl_leo/article/details/51559490


在使用OpenCV以及其他开源库时,往往一个容易忽略的问题就是使用默认参数,尤其是图像处理,会导致内存中的图像数据变换后被不同程度上被修改!

下面给出几个示例,帮助理解。

1. warpAffine

warpAffine是图像仿射变换函数,函数定义为:

  1. C++: void warpAffine(
  2. InputArray src,
  3. OutputArray dst,
  4. InputArray M,
  5. Size dsize,
  6. int flags=INTER_LINEAR,
  7. int borderMode=BORDER_CONSTANT,
  8. const Scalar& borderValue=Scalar())

其中,

- M是一个2x3的转换矩阵,关于获取方法,可使用getRotationMatrix2D()函数:

  • flags是一个标识符,结合了内插方法(interpolation methods)和可选项WARP_INVERSE_MAP

    • INTER_LINEAR - a bilinear interpolation (used by default) 双线性插值
    • INTER_NEAREST - a nearest-neighbor interpolation 最邻近插值
    • INTER_AREA - resampling using pixel area relation. It may be a preferred method for image decimation, as it gives moire’-free results. But when the image is zoomed, it is similar to the INTER_NEAREST method. 基于区域像素关系重采样
    • INTER_CUBIC - a bicubic interpolation over 4x4 pixel neighborhood 4x4邻域双三次插值
    • INTER_LANCZOS4 - a Lanczos interpolation over 8x8 pixel neighborhood 8x8邻域兰索斯插值
    • WARP_INVERSE_MAP - M is the inverse transformation () 等价于CV_WARP_INVERSE_MAP fills all of the destination image pixels M是的逆变换
  • borderMode: pixel extrapolation method 像素外推方法

    • BORDER_CONSTANT - pad the image with a constant value (used by default) 补上定值,如果使用则补上的定值设置为borderValue的值(默认为0)
    • BORDER_TRANSPARENT - the corresponding pixels in the destination image will not be modified at all 不做任何修改
    • BORDER_REPLICATE - the row or column at the very edge of the original is replicated to the extra border 将原始数据的行方向/列方向的边缘像素值作为外推边界

因为图像是离散的整数格网,一旦对像素值或者其下标进行浮点位运算,得到的结果都是近似值!几种内插方法各有优劣,双线性插值可以视为一个折中选择,即计算量不算很大(比基于区域和邻域块的方法小很多),效果也过得去(一般比最邻近插值更好),源码编写者大概是基于此考虑,将其设置为默认参数,但是针对某些具体的应用,绝不是最佳选择,例如对二值图像进行旋转,我们希望旋转后的图像仍然是二值的,那选择最临近插值可能就更合适。关于边界外推模式,这里贴上OpenCV官方文档:Adding borders to your images

2. imread & imwrite

以前写过一篇博客,讲述了OpenCV图像读取与存储的一些细节:Opencv 图像读取与保存问题, 其中有一些非常容易忽视的细节,例如使用imread()读取图像时,参数flags的值默认是1,也就是说默认读取的是3通道彩色图像,如果待读取的图像是单通道或者4通道的,也会被转成3通道图像,这样读取的数据就不是你真正想要的。

另外,使用imwrite()存储图像时,params参数也至关重要,其中包括特定图像存储编码参数设置,如果调用时缺省,就会使用默认参数,例如存储JPEG图像,图像压缩质量默认设置为95(范围为0~100,数值越大质量越好),存储为PNG时,压缩级别默认为3(0~9 越大压缩越厉害)。

3. Demo

生成一个简单的单通道200x200的二值图像127,255,之所以不使用0, 255,是为了使有些参数的使用对结果的影响更加明显:

test1.png

局部放大图:

test1-local

以下面这段代码为例,首先使用

  1. cv::Mat image = cv::imread("test1.png", IMREAD_UNCHANGED);
  2. const int cols = image.cols;
  3. const int rows = image.rows;
  4. cv::Mat R = cv::getRotationMatrix2D(
  5. cv::Point2f(
  6. static_cast<float>(cols/2),
  7. static_cast<float>(rows/2)),
  8. 30.0,
  9. 1.0);
  10. cv::Mat r_image/*(rows,cols,CV_8UC1, cv::Scalar(0))*/;
  11. cv::warpAffine(
  12. image,
  13. r_image,
  14. R,
  15. image.size(),
  16. INTER_LINEAR,
  17. BORDER_CONSTANT);
  18. // std::vector<int> compress_param;
  19. // compress_param.push_back(CV_IMWRITE_PNG_COMPRESSION);
  20. // compress_param.push_back(0);
  21. cv::imwrite("test1-r-l_c.png", r_image/*, compress_param*/);

warpAffine()imwrite()函数都先使用默认参数,并且旋转后的矩阵r_image在声明的时候,不进行初始化,即图像旋转后插值方式为双线性插值,边缘外推方式为自动补为0:

l_c

让我们放大局部:

l_c-local

warpAffine()函数中默认参数修改INTER_LINEAR -> INTER_NEAREST, BORDER_CONSTANT -> BORDER_TRANSPARENT ,即插值方法为最临近插值,边界不做任何调整(保持Mat的初始值,若未初始化,则会先进行初始化):

n_t

同样放大局部:

n_t-local

可以看出两者之间的明显区别,后者在边缘部分会保留原始数据的数据数值,但是为什么边界外推的像素颜色值是那样的,前面已经讲过:边界不做任何调整(保持Mat的初始值,若未初始化,则会先进行初始化),其中初始化值并不是0或者黑色。作为验证,我们在声明r_image的时候,对其进行初始化cv::Mat r_image(rows,cols,CV_8UC1, cv::Scalar(0));:

n_t-2

最后,再把图像存储压缩参数进行设置,即取消掉对compress_param的注释,虽然两个结果视觉上已经看不出差异,但是从文件大小上可以发现,压缩级为默认值(3)的图片大小为1.31KB,而压缩级为0的图片大小为39.3KB~真的差了很多,当然如果存储的JPG文件,分别使用下面的命令:

  1. // 1
  2. cv::imwrite("test1-r-n_t.jpg", r_image);
  3. // 2
  4. std::vector<int> compress_param;
  5. compress_param.push_back(IMWRITE_JPEG_QUALITY);
  6. compress_param.push_back(100);
  7. cv::imwrite("test1-r-n_t-2.jpg", r_input, compress_param);

让我们对比局部放大图:

1

2

明显可以看出,使用默认参数保存时,图像质量已经出现只管的下降,可以想象,如果不停地循环读取和保存同一幅图像,那么图像的质量将会以0.95的n次幂的速度降低。

4. Summary

讲述了那么多,还是回归到主题,很多时候为了方便大家使用,开源库的一些函数都会提供默认参数,而缺省参数的设置主要是基于能够适用大多数用户的基本需求,但是并不一定是性能或效果最佳,为了获得更好的结果,必须了解传入函数的各个参数的意义,针对现实的需求选择适合自己的,不然你的成果很有可能就失败在这些细小的边边角角上。

关于OpenCV图像操作的默认参数问题的更多相关文章

  1. opencv图像操作

      cvAbs 计算数组中所有元素的绝对值 cvAbsDiff 计算两个数组差值的绝对值 cvAbsDiffs 计算数组和标量差值的绝对值 cvAdd 两个数组的元素级的加运算 cvAdds 一个数组 ...

  2. python进阶—OpenCV之常用图像操作函数说明(转)

    文章目录cv2.thresholdcv2.bitwise_andcv2.bitwise_orcv2.bitwise_notcv2.inRangecv2.resizecv2.adaptiveThresh ...

  3. 关于图像读取函数imread()的一点使用经验,注意默认参数的赋值

    读入数字图像到数组,用CNN进行训练,发现关于图像读取的一个问题. 问题描述:读取灰度数字图像,在验证时发现存在错误,从图像到数组中的值不完全一样? main code as follows: int ...

  4. OpenCV图像金字塔:高斯金字塔、拉普拉斯金字塔与图片尺寸缩放

    这篇已经写得很好,真心给作者点个赞.题目都是直接转过来的,直接去看吧. Reference Link : http://blog.csdn.net/poem_qianmo/article/detail ...

  5. OPENCV形态学操作1

    形态学操作是指基于形状的一系列图像处理操作,包括膨胀,腐蚀,二值化,开运算,闭运算,顶帽算法,黑帽算法,形态学梯度等,最基本的形态学操作就是膨胀和腐蚀. 一.膨胀 首先需要明确一个概念,膨胀和腐蚀都是 ...

  6. Python用Pillow(PIL)进行简单的图像操作

    Python用Pillow(PIL)进行简单的图像操作 颜色与RGBA值 计算机通常将图像表示为RGB值,或者再加上alpha值(通透度,透明度),称为RGBA值.在Pillow中,RGBA的值表示为 ...

  7. 学习 opencv---(12)OpenCV 图像金字塔:高斯金字塔,拉普拉斯金字塔与图片尺寸缩放

    在这篇文章里,我们一起学习下 图像金字塔 的一些基本概念,如何使用OpenCV函数pyrUp和pyrDown 对图像进行向上和向下采样,以及了解专门用于缩放图像尺寸的resize函数的用法.此博文一共 ...

  8. opencv 矩阵操作

    OpenCv矩阵操作 有很多函数有mask,代表掩码,如果某位mask是0,那么对应的src的那一位就不计算,mask要和矩阵/ROI/的大小相等 大多数函数支持ROI,如果图像ROI被设置,那么只处 ...

  9. Imagelab-0-QT label显示 opencv 图像

    Imagelab-0-QT label显示 opencv 图像 opencvc++qtimagelab 开始之前 这其实也是opencv 处理图像的系列, 只是想我们在进一步复杂化我们的代码之前, 每 ...

随机推荐

  1. P1491 集合位置 次短路

    这个题是一个次短路的裸题,就是把最短路路径求出来之后依次删边,然后跑最短路,在这些情况里取最小值就行了. 题干: 每次有大的活动,大家都要在一起“聚一聚”,不管是去好乐迪,还是避风塘,或者汤姆熊,大家 ...

  2. P1552 派遣 左偏树

    左偏树就是一个应该用堆维护的区间,然后需要进行合并操作而发明的算法,其实这个算法没什么难的,和树剖有点像,维护几个数值,然后递归回来的时候就可以修改. 题干: 题目背景 在一个忍者的帮派里,一些忍者们 ...

  3. element-ui table 页面加载时,动态渲染后台传过来的数据(springmvc)

    jsp页面 <%@ page contentType="text/html;charset=UTF-8" language="java" %> &l ...

  4. codevs4511信息传递(Tarjan求环)

    题目描述 有n个同学(编号为1到n)正在玩一个信息传递的游戏.在游戏里每人都有一个固定的信息传递对象,其中,编号为i的同学的信息传递对象是编号为Ti同学. 游戏开始时,每人都只知道自己的生日.之后每一 ...

  5. StreamingListener技术点

    以下是对StreamingListene的研究,由于比较简单,故只贴代码,不做解释 /** * Created by gabry.wu on 2016/5/27. * 实现StreamingListe ...

  6. 【POJ3280/洛谷2890】[Usaco2007 Open Gold]Cheapest Palindrome(动态规划)

    题目: POJ3280 洛谷2980 分析: 首先,考虑只可以加字的情况 设\(s[i]\)表示第\(i\)个字符,\(add[i]\)表示加上一个字母\(i\)的花费,\(dp[i][j]\)表示把 ...

  7. 涨知识-VI 基于TCP/UDP的应用层协议

    基于TCP/UDP的应用层协议: 基于TCP: Telnet(Teletype over the Network, 网络电传),通过一个终端(terminal)登陆到网络 FTP(File Trans ...

  8. 元组Tuple、数组Array、映射Map

    一.元组Tuple 元组Tuple是不同类型的值的聚集,元组的值将单个的值包含在圆括号中来构成,元组可以包含一个不同类型的元素 如 val riple = (100, "Scala" ...

  9. sql中表变量

    今天在公司看sql优化的文章的时候,提到了表变量,做下笔记. 表变量 顺便复习下临时表.

  10. 转 IDEA 解决代码提示功能消失

    转载路径是  https://blog.csdn.net/hmily_hui/article/details/78213037 原文地址:https://github.com/Damao/Intell ...