最近因为工作需要,需要实现一个Grabcut函数。Opencv已经提供此函数,今天把opencv的例程拿出来跑了一下,对于简单的背景实现效果还不错。

OpenCV中的GrabCut算法是依据《"GrabCut" - Interactive Foreground Extraction using Iterated Graph Cuts》这篇文章来实现的。

此论文地址为:http://research.microsoft.com/en-us/um/people/ablake/papers/ablake/siggraph04.pdf

下面是Opencv中GrabCut函数调用事例。

  1. #include "opencv2/highgui/highgui.hpp"
  2. #include "opencv2/imgproc/imgproc.hpp"
  3.  
  4. #include <iostream>
  5.  
  6. using namespace std;
  7. using namespace cv;
  8.  
  9. static void help()
  10. {
  11. cout << "\nThis program demonstrates GrabCut segmentation -- select an object in a region\n"
  12. "and then grabcut will attempt to segment it out.\n"
  13. "Call:\n"
  14. "./grabcut <image_name>\n"
  15. "\nSelect a rectangular area around the object you want to segment\n" <<
  16. "\nHot keys: \n"
  17. "\tESC - quit the program\n"
  18. "\tr - restore the original image\n"
  19. "\tn - next iteration\n"
  20. "\n"
  21. "\tleft mouse button - set rectangle\n"
  22. "\n"
  23. "\tCTRL+left mouse button - set GC_BGD pixels\n"
  24. "\tSHIFT+left mouse button - set CG_FGD pixels\n"
  25. "\n"
  26. "\tCTRL+right mouse button - set GC_PR_BGD pixels\n"
  27. "\tSHIFT+right mouse button - set CG_PR_FGD pixels\n" << endl;
  28. }
  29.  
  30. const Scalar RED = Scalar(0,0,255);
  31. const Scalar PINK = Scalar(230,130,255);
  32. const Scalar BLUE = Scalar(255,0,0);
  33. const Scalar LIGHTBLUE = Scalar(255,255,160);
  34. const Scalar GREEN = Scalar(0,255,0);
  35.  
  36. const int BGD_KEY = CV_EVENT_FLAG_CTRLKEY; //Ctrl键
  37. const int FGD_KEY = CV_EVENT_FLAG_SHIFTKEY; //Shift键
  38.  
  39. static void getBinMask( const Mat& comMask, Mat& binMask )
  40. {
  41. if( comMask.empty() || comMask.type()!=CV_8UC1 )
  42. CV_Error( CV_StsBadArg, "comMask is empty or has incorrect type (not CV_8UC1)" );
  43. if( binMask.empty() || binMask.rows!=comMask.rows || binMask.cols!=comMask.cols )
  44. binMask.create( comMask.size(), CV_8UC1 );
  45. binMask = comMask & 1; //得到mask的最低位,实际上是只保留确定的或者有可能的前景点当做mask
  46. }
  47.  
  48. class GCApplication
  49. {
  50. public:
  51. enum{ NOT_SET = 0, IN_PROCESS = 1, SET = 2 };
  52. static const int radius = 2;
  53. static const int thickness = -1;
  54.  
  55. void reset();
  56. void setImageAndWinName( const Mat& _image, const string& _winName );
  57. void showImage() const;
  58. void mouseClick( int event, int x, int y, int flags, void* param );
  59. int nextIter();
  60. int getIterCount() const { return iterCount; }
  61. private:
  62. void setRectInMask();
  63. void setLblsInMask( int flags, Point p, bool isPr );
  64.  
  65. const string* winName;
  66. const Mat* image;
  67. Mat mask;
  68. Mat bgdModel, fgdModel;
  69.  
  70. uchar rectState, lblsState, prLblsState;
  71. bool isInitialized;
  72.  
  73. Rect rect;
  74. vector<Point> fgdPxls, bgdPxls, prFgdPxls, prBgdPxls;
  75. int iterCount;
  76. };
  77.  
  78. /*给类的变量赋值*/
  79. void GCApplication::reset()
  80. {
  81. if( !mask.empty() )
  82. mask.setTo(Scalar::all(GC_BGD));
  83. bgdPxls.clear(); fgdPxls.clear();
  84. prBgdPxls.clear(); prFgdPxls.clear();
  85.  
  86. isInitialized = false;
  87. rectState = NOT_SET; //NOT_SET == 0
  88. lblsState = NOT_SET;
  89. prLblsState = NOT_SET;
  90. iterCount = 0;
  91. }
  92.  
  93. /*给类的成员变量赋值而已*/
  94. void GCApplication::setImageAndWinName( const Mat& _image, const string& _winName )
  95. {
  96. if( _image.empty() || _winName.empty() )
  97. return;
  98. image = &_image;
  99. winName = &_winName;
  100. mask.create( image->size(), CV_8UC1);
  101. reset();
  102. }
  103.  
  104. /*显示4个点,一个矩形和图像内容,因为后面的步骤很多地方都要用到这个函数,所以单独拿出来*/
  105. void GCApplication::showImage() const
  106. {
  107. if( image->empty() || winName->empty() )
  108. return;
  109.  
  110. Mat res;
  111. Mat binMask;
  112. if( !isInitialized )
  113. image->copyTo( res );
  114. else
  115. {
  116. getBinMask( mask, binMask );
  117. image->copyTo( res, binMask ); //按照最低位是0还是1来复制,只保留跟前景有关的图像,比如说可能的前景,可能的背景
  118. }
  119.  
  120. vector<Point>::const_iterator it;
  121. /*下面4句代码是将选中的4个点用不同的颜色显示出来*/
  122. for( it = bgdPxls.begin(); it != bgdPxls.end(); ++it ) //迭代器可以看成是一个指针
  123. circle( res, *it, radius, BLUE, thickness );
  124. for( it = fgdPxls.begin(); it != fgdPxls.end(); ++it ) //确定的前景用红色表示
  125. circle( res, *it, radius, RED, thickness );
  126. for( it = prBgdPxls.begin(); it != prBgdPxls.end(); ++it )
  127. circle( res, *it, radius, LIGHTBLUE, thickness );
  128. for( it = prFgdPxls.begin(); it != prFgdPxls.end(); ++it )
  129. circle( res, *it, radius, PINK, thickness );
  130.  
  131. /*画矩形*/
  132. if( rectState == IN_PROCESS || rectState == SET )
  133. rectangle( res, Point( rect.x, rect.y ), Point(rect.x + rect.width, rect.y + rect.height ), GREEN, 2);
  134.  
  135. IplImage pImg= IplImage(res);
  136. IplImage *img=&pImg;
  137. cvShowImage(winName->c_str(),img);
  138. //imshow( *winName, res );
  139. //waitKey(30);
  140.  
  141. }
  142.  
  143. /*该步骤完成后,mask图像中rect内部是3,外面全是0*/
  144. void GCApplication::setRectInMask()
  145. {
  146. assert( !mask.empty() );
  147. mask.setTo( GC_BGD ); //GC_BGD == 0
  148. rect.x = max(0, rect.x);
  149. rect.y = max(0, rect.y);
  150. rect.width = min(rect.width, image->cols-rect.x);
  151. rect.height = min(rect.height, image->rows-rect.y);
  152. (mask(rect)).setTo( Scalar(GC_PR_FGD) ); //GC_PR_FGD == 3,矩形内部,为可能的前景点
  153. }
  154.  
  155. void GCApplication::setLblsInMask( int flags, Point p, bool isPr )
  156. {
  157. vector<Point> *bpxls, *fpxls;
  158. uchar bvalue, fvalue;
  159. if( !isPr ) //确定的点
  160. {
  161. bpxls = &bgdPxls;
  162. fpxls = &fgdPxls;
  163. bvalue = GC_BGD; //0
  164. fvalue = GC_FGD; //1
  165. }
  166. else //概率点
  167. {
  168. bpxls = &prBgdPxls;
  169. fpxls = &prFgdPxls;
  170. bvalue = GC_PR_BGD; //2
  171. fvalue = GC_PR_FGD; //3
  172. }
  173. if( flags & BGD_KEY )
  174. {
  175. bpxls->push_back(p);
  176. circle( mask, p, radius, bvalue, thickness ); //该点处为2
  177. }
  178. if( flags & FGD_KEY )
  179. {
  180. fpxls->push_back(p);
  181. circle( mask, p, radius, fvalue, thickness ); //该点处为3
  182. }
  183. }
  184.  
  185. /*鼠标响应函数,参数flags为CV_EVENT_FLAG的组合*/
  186. void GCApplication::mouseClick( int event, int x, int y, int flags, void* )
  187. {
  188. // TODO add bad args check
  189. switch( event )
  190. {
  191. case CV_EVENT_LBUTTONDOWN: // set rect or GC_BGD(GC_FGD) labels
  192. {
  193. bool isb = (flags & BGD_KEY) != 0,
  194. isf = (flags & FGD_KEY) != 0;
  195. if( rectState == NOT_SET && !isb && !isf )//只有左键按下时
  196. {
  197. rectState = IN_PROCESS; //表示正在画矩形
  198. rect = Rect( x, y, 1, 1 );
  199. }
  200. if ( (isb || isf) && rectState == SET ) //按下了alt键或者shift键,且画好了矩形,表示正在画前景背景点
  201. lblsState = IN_PROCESS;
  202. }
  203. break;
  204. case CV_EVENT_RBUTTONDOWN: // set GC_PR_BGD(GC_PR_FGD) labels
  205. {
  206. bool isb = (flags & BGD_KEY) != 0,
  207. isf = (flags & FGD_KEY) != 0;
  208. if ( (isb || isf) && rectState == SET ) //正在画可能的前景背景点
  209. prLblsState = IN_PROCESS;
  210. }
  211. break;
  212. case CV_EVENT_LBUTTONUP:
  213. if( rectState == IN_PROCESS )
  214. {
  215. rect = Rect( Point(rect.x, rect.y), Point(x,y) ); //矩形结束
  216. rectState = SET;
  217. setRectInMask();
  218. assert( bgdPxls.empty() && fgdPxls.empty() && prBgdPxls.empty() && prFgdPxls.empty() );
  219. showImage();
  220. }
  221. if( lblsState == IN_PROCESS ) //已画了前后景点
  222. {
  223. setLblsInMask(flags, Point(x,y), false); //画出前景点
  224. lblsState = SET;
  225. showImage();
  226. }
  227. break;
  228. case CV_EVENT_RBUTTONUP:
  229. if( prLblsState == IN_PROCESS )
  230. {
  231. setLblsInMask(flags, Point(x,y), true); //画出背景点
  232. prLblsState = SET;
  233. showImage();
  234. }
  235. break;
  236. case CV_EVENT_MOUSEMOVE:
  237. if( rectState == IN_PROCESS )
  238. {
  239. rect = Rect( Point(rect.x, rect.y), Point(x,y) );
  240. assert( bgdPxls.empty() && fgdPxls.empty() && prBgdPxls.empty() && prFgdPxls.empty() );
  241. showImage(); //不断的显示图片
  242. }
  243. else if( lblsState == IN_PROCESS )
  244. {
  245. setLblsInMask(flags, Point(x,y), false);
  246. showImage();
  247. }
  248. else if( prLblsState == IN_PROCESS )
  249. {
  250. setLblsInMask(flags, Point(x,y), true);
  251. showImage();
  252. }
  253. break;
  254. }
  255. }
  256.  
  257. /*该函数进行grabcut算法,并且返回算法运行迭代的次数*/
  258. int GCApplication::nextIter()
  259. {
  260. if( isInitialized )
  261. //使用grab算法进行一次迭代,参数2为mask,里面存的mask位是:矩形内部除掉那些可能是背景或者已经确定是背景后的所有的点,且mask同时也为输出
  262. //保存的是分割后的前景图像
  263. grabCut( *image, mask, rect, bgdModel, fgdModel, 1 );
  264. else
  265. {
  266. if( rectState != SET )
  267. return iterCount;
  268.  
  269. if( lblsState == SET || prLblsState == SET )
  270. grabCut( *image, mask, rect, bgdModel, fgdModel, 1, GC_INIT_WITH_MASK );
  271. else
  272. grabCut( *image, mask, rect, bgdModel, fgdModel, 1, GC_INIT_WITH_RECT );
  273.  
  274. isInitialized = true;
  275. }
  276. iterCount++;
  277.  
  278. bgdPxls.clear(); fgdPxls.clear();
  279. prBgdPxls.clear(); prFgdPxls.clear();
  280.  
  281. return iterCount;
  282. }
  283.  
  284. GCApplication gcapp;
  285.  
  286. static void on_mouse( int event, int x, int y, int flags, void* param )
  287. {
  288. gcapp.mouseClick( event, x, y, flags, param );
  289. }
  290.  
  291. int main( int argc, char** argv )
  292. {
  293.  
  294. char filename[]="test.jpg";
  295. IplImage* pImg = cvLoadImage(filename);
  296.  
  297. Mat image(pImg,0);
  298. if( image.empty() )
  299. {
  300. cout << "\n Durn, couldn't read image filename " << filename << endl;
  301. return 1;
  302. }
  303.  
  304. help();
  305.  
  306. const string winName = "image";
  307. cvNamedWindow( winName.c_str(), CV_WINDOW_AUTOSIZE );
  308. cvSetMouseCallback( winName.c_str(), on_mouse, 0 );
  309.  
  310. gcapp.setImageAndWinName( image, winName );
  311. gcapp.showImage();
  312.  
  313. for(;;)
  314. {
  315. int c = cvWaitKey(0);
  316. switch( (char) c )
  317. {
  318. case '\x1b':
  319. cout << "Exiting ..." << endl;
  320. goto exit_main;
  321. case 'r':
  322. cout << endl;
  323. gcapp.reset();
  324. gcapp.showImage();
  325. break;
  326. case 'n':
  327. int iterCount = gcapp.getIterCount();
  328. cout << "<" << iterCount << "... ";
  329. int newIterCount = gcapp.nextIter();
  330. if( newIterCount > iterCount )
  331. {
  332. gcapp.showImage();
  333. cout << iterCount << ">" << endl;
  334. }
  335. else
  336. cout << "rect must be determined>" << endl;
  337. break;
  338. }
  339. }
  340.  
  341. exit_main:
  342. cvDestroyWindow( winName.c_str() );
  343. return 0;
  344. }

  效果图大概如下:

上三个图依次为原图、标记图片、分割后的照片,还可以继续迭代的分割,除了速度慢点,实现的效果还是非常好的。

GrabCut--Opencv篇的更多相关文章

  1. 【计算机视觉】OpenCV篇(10) - 模式识别中的模板匹配

    什么是模式识别? 它指的是,对表征事物或现象的各种形式的信息进行处理和分析,从而达到对事物或现象进行描述.辨认.分类和解释的目的. 我们之所以可以很快辨别猫是猫.O不是0,就是因为在我们大脑中已经给猫 ...

  2. 【计算机视觉】OpenCV篇(9) - 轮廓(寻找/绘制轮廓)

    什么是轮廓? 轮廓是一系列相连的点组成的曲线,代表了物体的基本外形. 轮廓与边缘好像挺像的? 是的,确实挺像,那么区别是什么呢?简而言之,轮廓是连续的,而边缘并不全都连续(见下图示例).其实边缘主要是 ...

  3. 【计算机视觉】OpenCV篇(6) - 平滑图像(卷积/滤波/模糊/降噪)

    平滑滤波 平滑滤波是低频增强的空间域滤波技术.空间域滤波技术即不经由傅立叶转换,直接处理影像中的像素,它的目的有两类:一类是模糊:另一类是消除噪音.空间域的平滑滤波一般采用简单平均法进行,就是求邻近像 ...

  4. 【计算机视觉】OpenCV篇(4) - Pycharm+PyQt5+Python小项目实战

    1.下载安装 (1)Pycharm:下载链接 (2)推荐使用Qt Designer来设计界面,如果你装的是Anaconda的话,就已经自带了designer.exe,我这里使用的是Pycharm的虚拟 ...

  5. 【计算机视觉】OpenCV篇(5) - 仿射变换与透视变换

    参考: 图像处理的仿射变换与透视变换(https://www.imooc.com/article/27535) http://ex2tron.wang/opencv-python-extra-warp ...

  6. opencv 学习资料

    [视觉与图像]OpenCV篇:Python+OpenCV实用教程 Python+OpenCV教程15:直方图

  7. TGL站长关于常见问题的回复

    问题地址: http://www.thegrouplet.com/thread-112923-1-1.html 问题: 网站配有太多的模板是否影响网站加载速度 月光答复: wp不需要删除其他的模板,不 ...

  8. opencv 61篇

    (一)--安装配置.第一个程序 标签: imagebuildincludeinputpathcmd 2011-10-21 16:16 41132人阅读 评论(50) 收藏 举报  分类: OpenCV ...

  9. GrabCut in One Cut(基于图割算法grabcut的一次快速图像分割的OpenCV实现)----目前效果最好的图割

     One cut in grabcut(grabcut算法的非迭代实现?) 本文针对交互式图像分割中的图割算法,主要想翻译一篇英文文献.不足之处请大家指正. 这是博主近期看到的效果最好,实现最简单 ...

  10. 图像分割之(四)OpenCV的GrabCut函数使用和源码解读

    图像分割之(四)OpenCV的GrabCut函数使用和源码解读         分类:            图像处理            计算机视觉             2013-01-23 ...

随机推荐

  1. ant-学习记录二

    <?xml version="1.0"?> <project name="targetStudy" default="mkdir&q ...

  2. 自己用js写的两个日历控件

    前一阵写了两个日历控件,做了简单的封装,发出来共朋友们参考. 第一个日历控件,条状的日历. (使用方法:调用initBarTime(id,evn),第一个参数是要渲染div的id,第二个参数是点击日期 ...

  3. C++界面库

    刚开始用C++做界面的时候,根本不知道怎么用简陋的MFC控件做出比较美观的界面,后来就开始逐渐接触到BCG  Xtreme ToolkitPro v15.0.1,Skin++,等界面库,以及一些网友自 ...

  4. 软件project师的属性与发展

    工作近十年了.[软件project师] 一直是我职业 title 的中心词,仅仅是前面的修饰语在不断变化,从0基础.中级.高级到资深. 事实上 [软件project师] 是一个非常泛化的定义.工作现实 ...

  5. docker 学习手冊-中文版下载

    这个PDF算是学习docker的一个小总结,全部文章摘自我在csdn的博客专栏: http://blog.csdn.net/column/details/docker.html 第一章到第八章摘自do ...

  6. tab group of firefox

    https://addons.mozilla.org/en-US/firefox/addon/tabgroups-menu/? src=search#detail-relnotes https://g ...

  7. BZOJ 1112: [POI2008]砖块Klo1112( BST )

    枚举每个长度为k的区间, 然后用平衡树找中位数进行判断, 时间复杂度O(nlogn). 早上起来精神状态不太好...连平衡树都不太会写了...果断去看了会儿番然后就A了哈哈哈 ------------ ...

  8. 使用 Spring RestTemplate 调用 rest 服务时自定义请求头(custom HTTP headers)

    在 Spring 3.0 中可以通过  HttpEntity 对象自定义请求头信息,如: private static final String APPLICATION_PDF = "app ...

  9. 操作引入xml文件的书包(定位到指定节点)

    定位到指定节点:e0.1 <chtml><we>@{_samples/test.xml:HtokID=e0.1}</we></chtml> 上述表达式表 ...

  10. 以交互方式使用exp/imp的演示

    众所周知,用exp/imp对数据库进行逻辑备份.包含表.用户,整个数据库,我们通常所熟悉的是使用命令行指定參数的方式来做的.以下我来演示一下不太经常使用的以交互方式的操作,操作非常easy.就是仅仅要 ...