GOICE项目初探

在图像拼接方面，市面上能够找到的软件中，要数MS的ICE效果、鲁棒性最好，而且界面也很美观。应该说有很多值得学习的地方，虽然这个项目不开源，但是利用现有的资料，也可以实现很多具体的拼接工作。

基于现有的有限资源，主要是以opencv自己提供的stitch_detail进行修改和封包，基于ribbon编写界面，我也尝试实现了GOICE项目，实现全景图片的拼接、横向视频的拼接，如果下一步有时间的话再将双目实时拼接从以前的代码中移植过来。

这里简单地将一些技术要点进行解析，欢迎批评指正和合作交流！

一、对现有算法进行重新封装

opencv原本的算法主要包含在Stitching Pipeline中，结构相对比较复杂，具体可以查看opencv refman

对算法进行重构后整理如下：

 //使用变量

    Ptr<FeaturesFinder> finder;

    Mat full_img, img;

    int num_images = m_ImageList.size();

    vector<ImageFeatures> features(num_images);

    vector<Mat> images(num_images);

    vector<cv::Size> full_img_sizes(num_images);

    double seam_work_aspect = ;

    vector<MatchesInfo> pairwise_matches;

    BestOf2NearestMatcher matcher(try_gpu, match_conf);

    vector<int> indices;

    vector<Mat> img_subset;

    vector<cv::Size> full_img_sizes_subset;

    HomographyBasedEstimator estimator;

    vector<CameraParams> cameras;

    vector<cv::Point> corners(num_images);

    vector<Mat> masks_warped(num_images);

    vector<Mat> images_warped(num_images);

    vector<cv::Size> sizes(num_images);

    vector<Mat> masks(num_images);

    Mat img_warped, img_warped_s;

    Mat dilated_mask, seam_mask, mask, mask_warped;

    Ptr<Blender> blender;

    double compose_work_aspect = ;

    //拼接开始

    if (features_type == "surf")

        finder = new SurfFeaturesFinder();

    else

        finder = new OrbFeaturesFinder();

    //寻找特征点

    m_progress.SetPos();

    for (int i = ; i < num_images; ++i)

    {

        full_img = m_ImageList[i].clone();

        full_img_sizes[i] = full_img.size();//读到的是大小

        if (full_img.empty())

        {

            MessageBox("图片读取错误，请确认后重新尝试!");

            return;

        }

        if (work_megapix < )

        {

            img = full_img;

            work_scale = ;

            is_work_scale_set = true;

        }else{

            if (!is_work_scale_set)

            {

                work_scale = min(1.0, sqrt(work_megapix * 1e6 / full_img.size().area()));

                is_work_scale_set = true;

            }

            resize(full_img, img, cv::Size(), work_scale, work_scale);

        }

        if (!is_seam_scale_set)

        {

            seam_scale = min(1.0, sqrt(seam_megapix * 1e6 / full_img.size().area()));

            seam_work_aspect = seam_scale / work_scale;

            is_seam_scale_set = true;

        }

        (*finder)(img, features[i]);

        features[i].img_idx = i;

        resize(full_img, img, cv::Size(), seam_scale, seam_scale);

        images[i] = img.clone();

    }

    finder->collectGarbage();

    full_img.release();

    img.release();

    //进行匹配

    m_progress.SetPos();

    matcher(features, pairwise_matches);

    matcher.collectGarbage();

    indices  = leaveBiggestComponent(features, pairwise_matches, conf_thresh);

    for (size_t i = ; i < indices.size(); ++i)

    {

        img_subset.push_back(images[indices[i]]);

        full_img_sizes_subset.push_back(full_img_sizes[indices[i]]);

    }

    m_progress.SetPos();

    images = img_subset;

    //判断图片是否足够

    num_images = static_cast<int>(img_subset.size());

    if (num_images < )

    {

        MessageBox("图片特征太少，尝试添加更多图片!");

        return;

    }

    estimator(features, pairwise_matches, cameras);

    for (size_t i = ; i < cameras.size(); ++i)

    {

        Mat R;

        cameras[i].R.convertTo(R, CV_32F);

        cameras[i].R = R;

        //LOGLN("Initial intrinsics #" << indices[i]+1 << ":\n" << cameras[i].K());

    }

    //开始对准

    m_progress.SetPos();

    Ptr<detail::BundleAdjusterBase> adjuster;

    if (ba_cost_func == "reproj") adjuster = new detail::BundleAdjusterReproj();

    else

    adjuster = new detail::BundleAdjusterRay();

    adjuster->setConfThresh(conf_thresh);

    Mat_<uchar> refine_mask = Mat::zeros(, , CV_8U);

    if (ba_refine_mask[] == 'x') refine_mask(,) = ;

    if (ba_refine_mask[] == 'x') refine_mask(,) = ;

    if (ba_refine_mask[] == 'x') refine_mask(,) = ;

    if (ba_refine_mask[] == 'x') refine_mask(,) = ;

    if (ba_refine_mask[] == 'x') refine_mask(,) = ;

    adjuster->setRefinementMask(refine_mask);

    (*adjuster)(features, pairwise_matches, cameras);

    // Find median focal length

    vector<double> focals;

    for (size_t i = ; i < cameras.size(); ++i)

        focals.push_back(cameras[i].focal);

    sort(focals.begin(), focals.end());

    float warped_image_scale;

    if (focals.size() %  == )

        warped_image_scale = static_cast<float>(focals[focals.size() / ]);

    else

        warped_image_scale = static_cast<float>(focals[focals.size() /  - ] + focals[focals.size() / ]) * 0.5f;

    //开始融合

    m_progress.SetPos();

    if (do_wave_correct)

    {

        vector<Mat> rmats;

        for (size_t i = ; i < cameras.size(); ++i)

            rmats.push_back(cameras[i].R);

        waveCorrect(rmats, wave_correct);

        for (size_t i = ; i < cameras.size(); ++i)

            cameras[i].R = rmats[i];

    }

    //最后修正

    m_progress.SetPos();

    // Preapre images masks

    for (int i = ; i < num_images; ++i)

    {

        masks[i].create(images[i].size(), CV_8U);

        masks[i].setTo(Scalar::all());

    }

    Ptr<WarperCreator> warper_creator;

    {

        if (warp_type == "plane") warper_creator = new cv::PlaneWarper();

        else if (warp_type == "cylindrical") warper_creator = new cv::CylindricalWarper();

        else if (warp_type == "spherical") warper_creator = new cv::SphericalWarper();

        else if (warp_type == "fisheye") warper_creator = new cv::FisheyeWarper();

        else if (warp_type == "stereographic") warper_creator = new cv::StereographicWarper();

        else if (warp_type == "compressedPlaneA2B1") warper_creator = new cv::CompressedRectilinearWarper(, );

        else if (warp_type == "compressedPlaneA1.5B1") warper_creator = new cv::CompressedRectilinearWarper(1.5, );

        else if (warp_type == "compressedPlanePortraitA2B1") warper_creator = new cv::CompressedRectilinearPortraitWarper(, );

        else if (warp_type == "compressedPlanePortraitA1.5B1") warper_creator = new cv::CompressedRectilinearPortraitWarper(1.5, );

        else if (warp_type == "paniniA2B1") warper_creator = new cv::PaniniWarper(, );

        else if (warp_type == "paniniA1.5B1") warper_creator = new cv::PaniniWarper(1.5, );

        else if (warp_type == "paniniPortraitA2B1") warper_creator = new cv::PaniniPortraitWarper(, );

        else if (warp_type == "paniniPortraitA1.5B1") warper_creator = new cv::PaniniPortraitWarper(1.5, );

        else if (warp_type == "mercator") warper_creator = new cv::MercatorWarper();

        else if (warp_type == "transverseMercator") warper_creator = new cv::TransverseMercatorWarper();

    }

    if (warper_creator.empty())

    {

        cout << "Can't create the following warper '" << warp_type << "'\n";

        return;}

    Ptr<RotationWarper> warper = warper_creator->create(static_cast<float>(warped_image_scale * seam_work_aspect));

    for (int i = ; i < num_images; ++i)

    {

        Mat_<float> K;

        cameras[i].K().convertTo(K, CV_32F);

        float swa = (float)seam_work_aspect;

        K(,) *= swa; K(,) *= swa;

        K(,) *= swa; K(,) *= swa;

        corners[i] = warper->warp(images[i], K, cameras[i].R, INTER_LINEAR, BORDER_REFLECT, images_warped[i]);

        sizes[i] = images_warped[i].size();

        warper->warp(masks[i], K, cameras[i].R, INTER_NEAREST, BORDER_CONSTANT, masks_warped[i]);

    }

    vector<Mat> images_warped_f(num_images);

    for (int i = ; i < num_images; ++i)

        images_warped[i].convertTo(images_warped_f[i], CV_32F);

    Ptr<ExposureCompensator> compensator = ExposureCompensator::createDefault(expos_comp_type);

    compensator->feed(corners, images_warped, masks_warped);

    //接缝修正

    m_progress.SetPos();

    Ptr<SeamFinder> seam_finder;

    if (seam_find_type == "no")

        seam_finder = new detail::NoSeamFinder();

    else if (seam_find_type == "voronoi")

        seam_finder = new detail::VoronoiSeamFinder();

    else if (seam_find_type == "gc_color")

        seam_finder = new detail::GraphCutSeamFinder(GraphCutSeamFinderBase::COST_COLOR);

    else if (seam_find_type == "gc_colorgrad")

        seam_finder = new detail::GraphCutSeamFinder(GraphCutSeamFinderBase::COST_COLOR_GRAD);

    else if (seam_find_type == "dp_color")

        seam_finder = new detail::DpSeamFinder(DpSeamFinder::COLOR);

    else if (seam_find_type == "dp_colorgrad")

        seam_finder = new detail::DpSeamFinder(DpSeamFinder::COLOR_GRAD);

    if (seam_finder.empty())

    {

        MessageBox("无法对图像进行缝隙融合");

        return;

    }

    //输出最后结果

    m_progress.SetPos();

    seam_finder->find(images_warped_f, corners, masks_warped);

    // Release unused memory

    images.clear();

    images_warped.clear();

    images_warped_f.clear();

    masks.clear();

    for (int img_idx = ; img_idx < num_images; ++img_idx)

    {

        // Read image and resize it if necessary

        full_img = m_ImageList[img_idx];

        if (!is_compose_scale_set)

        {

            if (compose_megapix > )

                compose_scale = min(1.0, sqrt(compose_megapix * 1e6 / full_img.size().area()));

            is_compose_scale_set = true;

            // Compute relative scales

            compose_work_aspect = compose_scale / work_scale;

            // Update warped image scale

            warped_image_scale *= static_cast<float>(compose_work_aspect);

            warper = warper_creator->create(warped_image_scale);

            // Update corners and sizes

            for (int i = ; i < num_images; ++i)

            {

                // Update intrinsics

                cameras[i].focal *= compose_work_aspect;

                cameras[i].ppx *= compose_work_aspect;

                cameras[i].ppy *= compose_work_aspect;

                // Update corner and size

                cv::Size sz = full_img_sizes[i];

                if (std::abs(compose_scale - ) > 1e-)

                {

                    sz.width = cvRound(full_img_sizes[i].width * compose_scale);

                    sz.height = cvRound(full_img_sizes[i].height * compose_scale);

                }

                Mat K;

                cameras[i].K().convertTo(K, CV_32F);

                cv::Rect roi = warper->warpRoi(sz, K, cameras[i].R);

                corners[i] = roi.tl();

                sizes[i] = roi.size();

            }

        }

        if (abs(compose_scale - ) > 1e-)

            resize(full_img, img, cv::Size(), compose_scale, compose_scale);

        else

            img = full_img;

        full_img.release();

        cv::Size img_size = img.size();

        Mat K;

        cameras[img_idx].K().convertTo(K, CV_32F);

        // Warp the current image

        warper->warp(img, K, cameras[img_idx].R, INTER_LINEAR, BORDER_REFLECT, img_warped);

        // Warp the current image mask

        mask.create(img_size, CV_8U);

        mask.setTo(Scalar::all());

        warper->warp(mask, K, cameras[img_idx].R, INTER_NEAREST, BORDER_CONSTANT, mask_warped);

        // Compensate exposure

        compensator->apply(img_idx, corners[img_idx], img_warped, mask_warped);

        img_warped.convertTo(img_warped_s, CV_16S);

        img_warped.release();

        img.release();

        mask.release();

        dilate(masks_warped[img_idx], dilated_mask, Mat());

        resize(dilated_mask, seam_mask, mask_warped.size());

        mask_warped = seam_mask & mask_warped;

        if (blender.empty())

        {

            blender = Blender::createDefault(blend_type, try_gpu);

            cv::Size dst_sz = resultRoi(corners, sizes).size();

            float blend_width = sqrt(static_cast<float>(dst_sz.area())) * blend_strength / .f;

            if (blend_width < .f)

                blender = Blender::createDefault(Blender::NO, try_gpu);

            else if (blend_type == Blender::MULTI_BAND)

            {

                MultiBandBlender* mb = dynamic_cast<MultiBandBlender*>(static_cast<Blender*>(blender));

                mb->setNumBands(static_cast<int>(ceil(log(blend_width)/log(.)) - .));

                LOGLN("Multi-band blender, number of bands: " << mb->numBands());

            }

            else if (blend_type == Blender::FEATHER)

            {

                FeatherBlender* fb = dynamic_cast<FeatherBlender*>(static_cast<Blender*>(blender));

                fb->setSharpness(.f/blend_width);

                LOGLN("Feather blender, sharpness: " << fb->sharpness());

            }

            blender->prepare(corners, sizes);

        }

        // Blend the current image

        blender->feed(img_warped_s, mask_warped, corners[img_idx]);

    }

    Mat result, result_mask;

    blender->blend(result, result_mask);

    m_progress.SetPos();

    AfxMessageBox("拼接成功!");

    m_progress.ShowWindow(false);

    m_progress.SetPos();

    //格式转换

    result.convertTo(result,CV_8UC3);

    showImage(result,IDC_PBDST);

    //保存结果

    m_matResult = result.clone();

基本上没有修改代码的结构，但是做了几个改变

1、原来的算法既读取文件名，又保存mat变量，我这里将其统一成为使用vector<Mat>来进行保存；

2、将LOGLN的部分以messagebox的方式显示出来，并且进行错误控制；

3、添加适当注释，并且在合适的地方控制进度条显示。

二、主要界面编写技巧

主要界面使用了Ribbon的方法，结合使用IconWorkshop生成图标。如何生成这样的图片在我的博客中有专门介绍。

内容方面，使用了基于listctrl的缩略图的显示,具体参考我的另一篇blog--"图像处理界面--缩略图的显示"

三、视频拼接的处理方法

相比较图像拼接，这次添加了一个“横向视频”的拼接。其实算法原理是比较朴素的（当然这里考虑的是比较简单的情况）。就是对于精心拍摄的视频，那么只要每隔一段时间取一个图片，然后把这些图片进行拼接，就能够得到视频的全景图片。

void CMFCApplication1View::OnButtonOpenmov()

{

    CString pathName;

    CString szFilters= _T("*(*.*)|*.*|avi(*.avi)|*.avi|mp4(*.mp4)|*.mp4||");

    CFileDialog dlg(TRUE,NULL,NULL,NULL,szFilters,this);

    VideoCapture capture;

    Mat frame;

    int iFrameCount = ;

    int iFram = ;

    if(dlg.DoModal()==IDOK){

            //获得路径

            pathName=dlg.GetPathName();

            //设置窗体

            m_ListThumbnail.ShowWindow(false);

            m_imagerect.ShowWindow(false);

            m_imagedst.ShowWindow(true);

            m_progress.ShowWindow(false);

            m_msg.ShowWindow(false);

            //打开视频并且抽取图片

            capture.open((string)pathName);

            if (!capture.isOpened())

            {

                MessageBox("视频打开错误！");

                return;

            }

            m_VectorMovImageNames.clear();

            m_MovImageList.clear();

            char cbuf[];

            while (capture.read(frame))

            {

                //每隔50帧取一图

                if ( == iFram%)

                {

                    m_MovImageList.push_back(frame.clone());

                }

                showImage(frame,IDC_PBDST);

                iFram = iFram +;

            }

    }

}

四、反思和小结

1）虽然现在已经对opencv的算法进行了集成，但是由于算法原理还是繁琐复杂的，下一步要结合对更复杂问题的进一步研究吃透算法；

2）使用ribbon进行程序设计现在已经比较熟悉了。能够认识到工具擅长解决的问题、能够认识到工具不好解决的问题，能够快速实现，才算是掌握；

GOICE项目初探的更多相关文章

《ASP.NET MVC 5 破境之道》：第一境 ASP.Net MVC5项目初探 — 第三节：View层简单改造
第一境 ASP.Net MVC5项目初探 — 第三节:View层简单改造 MVC默认模板的视觉设计从MVC1到MVC3都没有改变,比较陈旧了:在MVC4中做了升级,好看些,在不同的分辨率下,也能工作得 ...
《ASP.NET MVC 5 破境之道》：第一境 ASP.Net MVC5项目初探 — 第二节：MVC5项目结构
第一境 ASP.Net MVC5项目初探 — 第二节:MVC5项目结构接下来,我们来看看,VS为我们自动创建的项目,是什么样子的? 可以通过菜单中[View]->[Solution Explo ...
《ASP.NET MVC 5 破境之道》：第一境 ASP.Net MVC5项目初探 — 第一节：运行第一个MVC5项目
第一境 ASP.Net MVC5项目初探 — 第一节:运行第一个MVC5项目创建一个MVC项目,是很容易的,大部分工作,VS都帮我们完成了.只需要按照如下步骤按部就班就可以了. 打开VS2017,选 ...
【Magenta 项目初探】手把手教你用Tensorflow神经网络创造音乐
原文链接:http://www.cnblogs.com/learn-to-rock/p/5677458.html 偶然在网上看到了一个让我很感兴趣的项目 Magenta,用Tensorflow让神经网 ...
django项目初探
一:创建django项目设置数据库(默认sqlit3) mysql: setting:中设置 DATABASES = { 'default': { 'ENGINE': 'django.db.back ...
ewasm项目初探
为了改进EVM1.0,以太坊的新一代虚拟机项目ewasm (github.com/ewasm)将支持WebAssembly(wasm),wasm在性能,扩展性,开发工具,社区都更有优势.除以太坊外,一 ...
云原生项目实践DevOps(GitOps)+K8S+BPF+SRE，从0到1使用Golang开发生产级麻将游戏服务器—第1篇
项目初探项目地址: 原项目:https://github.com/lonng/nanoserver 调过的:https://github.com/Kirk-Wang/nanoserver 这将是一个 ...
第01讲 Android开发系列---Activity
一. Android系统版本及详细信息最新数据 https://developer.android.com/about/dashboards/ 二. Android项目初探 1. 使用a ...
壹佰文章最全总结| 《关于ASP.NETCore的分享之路》
学习路线图 (关于学习ASP.NET Core需要了解和掌握的知识点图) 一言不合就来图,各位博客园小伙伴大家好,感觉好久没有写文章了,自从春节开始,中间经历种种,慢慢的就开始微信公众号发文了,原因有 ...

随机推荐

MAXFLOAT
CGSizeMake(300, MAXFLOAT),是计算宽和高的,里面的MAXFLOAT通俗点说就是最大的数值,代表你的label的宽和高是随着你label内容而变化,不用担心因为label内容过长 ...
创建Java类并实例化的基本过程
package com.sanguosha.java; /* * 面向对象实现的过程 * 1.创建类并设计类的成员(成员变量即属性and成员方法即方法) * 2.通过类来创建类的对象,也称类的实例化 ...
javabean实体类对象转为Map类型对象的方法(转发)
//将javabean实体类转为map类型,然后返回一个map类型的值 public static Map<String, Object> beanToMap(Object obj) { ...
ofbiz进击第六节。 --OFBiz配置之[widget.properties] 配置属性的分析
配置内容分析如下 # -- 定义上下文使用者 -- security.context =default # -- 定义密码限制长度最小值 -- password.length.min =5 # -- ...
怎么在eclipse里调试WebDriver的源代码（转）
当你看完WebDriver的工作原理这篇博客以后,是不是也跃跃欲试想印证文章里的理论是不是正确,想自己也看下webdriver的源代码,并且调试下,通过代码来更深入的了解WebDriver的工作原理. ...
demo04calc
package com.example.demo05simplecalc; import android.os.Bundle; import android.app.Activity; import ...
c语言小程序
这是一个用c语言写的小程序,功能是随机输出30道100以内的四则运算,先生成两个随机数,再通过随机数确定四则运算符号,最后输出题目. #include<iostream> using na ...
paper 68 ：MATLAB中取整函数(fix, floor, ceil, round)的使用
MATLAB取整函数 1)fix(x) : 截尾取整. >> fix( [3.12 -3.12]) ans = 3 -3 (2)floor(x):不超过x 的最大整数.(高 ...
mysql server安装及密码重置
官网上能下载到的mysql安装分两种:msi和zip安装 msi安装比较简单,直接下一步. 主要说zip格式的安装: 1.解压. zip解压后的文件夹改名后(也可以不改名)放在喜欢的位置.例如我放在C ...
利用API自动建立GL科目段组合
1.检查存在性,如没有则新增 fnd_flex_keyval.validate_segs('CREATE_COMBINATION' ...

GOICE项目初探

GOICE项目初探的更多相关文章

随机推荐

热门专题