机器学习：Colorization using Optimization

今天介绍 Siggraph 2004 年的一篇文章： Colorization using Optimization，利用优化的方法对灰度图像进行着色，这里用到了非常经典的泊松方程以及稀疏矩阵的线性优化。简单来说，就是对一张灰度图像先人为地进行着色，然后利用优化的方法，对其他的没有颜色的区域进行填充。这些处理都是在 YUV 颜色空间进行的。

给定一个 Y 通道的图像，我们希望基于一定的先验知识，恢复出图像的U, V 通道。这里的一个重要假设就是 对于相邻的两个像素，如果其亮度比较相似，那么其颜色也应该相似。

假设 r，s 表示相邻两个像素的位置，那么我们希望最小化如下的目标函数：

J(U)=∑r⎛⎝U(r)−∑s∈N(r)wrsU(s)⎞⎠2

对于 V 通道，我们可以建立类似的目标函数，而其中的系数 wrs 可以由 Y 通道表示：

wrs=e−(Y(r)−Y(s))2/2σ2

只要给定了 σ 以及像素的位置关系，我们可以很方便的求出系数 wrs。

首先，需要对图像进行一些简单的着色，我们可以得到一系列的像素点 ri 的颜色值, u(ri)=ui, v(ri)=vi , 根据这些预先设定的像素点的颜色值，再结合上面的目标函数，我们可以建立一个很大的稀疏线性方程组，假设图像的尺寸为 M×N, 那么图像的像素个数为 np=MN, 我们要解的方程组将是 np 个，稀疏矩阵的大小为 np×np，比如一张 800×600 的图像，需要解的方程组将是 480000 个，稀疏矩阵的大小将是 480000×480000 这是一个非常大的矩阵。不过由于这是稀疏的，所以会有很多标准的解法。

下面给出 matlab 代码



g_name='example.bmp';

c_name='example_marked.bmp';

out_name='example_res.bmp';

%set solver=1 to use a multi-grid solver

%and solver=2 to use an exact matlab "\" solver

solver=2; 

gI=double(imread(g_name))/255;

cI=double(imread(c_name))/255;

colorIm=(sum(abs(gI-cI),3)>0.01);

colorIm=double(colorIm);

sgI=rgb2ntsc(gI);

scI=rgb2ntsc(cI);

ntscIm(:,:,1)=sgI(:,:,1);

ntscIm(:,:,2)=scI(:,:,2);

ntscIm(:,:,3)=scI(:,:,3);

max_d=floor(log(min(size(ntscIm,1),size(ntscIm,2)))/log(2)-2);

iu=floor(size(ntscIm,1)/(2^(max_d-1)))*(2^(max_d-1));

ju=floor(size(ntscIm,2)/(2^(max_d-1)))*(2^(max_d-1));

id=1; jd=1;

colorIm=colorIm(id:iu,jd:ju,:);

ntscIm=ntscIm(id:iu,jd:ju,:);

if (solver==1)

  nI=getVolColor(colorIm,ntscIm,[],[],[],[],5,1);

  nI=ntsc2rgb(nI);

else

  nI=getColorExact(colorIm,ntscIm);

end

figure, imshow(nI)

imwrite(nI,out_name)

function [nI,snI]=getColorExact(colorIm,ntscIm)

n=size(ntscIm,1); m=size(ntscIm,2);

imgSize=n*m;

nI(:,:,1)=ntscIm(:,:,1);

indsM=reshape([1:imgSize],n,m);

lblInds=find(colorIm);

wd=1; 

len=0;

consts_len=0;

col_inds=zeros(imgSize*(2*wd+1)^2,1);

row_inds=zeros(imgSize*(2*wd+1)^2,1);

vals=zeros(imgSize*(2*wd+1)^2,1);

gvals=zeros(1,(2*wd+1)^2);

for j=1:m

   for i=1:n

      consts_len=consts_len+1;

      if (~colorIm(i,j))

        tlen=0;

        for ii=max(1,i-wd):min(i+wd,n)

           for jj=max(1,j-wd):min(j+wd,m)

              if (ii~=i)|(jj~=j)

                 len=len+1; tlen=tlen+1;

                 row_inds(len)= consts_len;

                 col_inds(len)=indsM(ii,jj);

                 gvals(tlen)=ntscIm(ii,jj,1);

              end

           end

        end

        t_val=ntscIm(i,j,1);

        gvals(tlen+1)=t_val;

        c_var=mean((gvals(1:tlen+1)-mean(gvals(1:tlen+1))).^2);

        csig=c_var*0.6;

        mgv=min((gvals(1:tlen)-t_val).^2);

        if (csig<(-mgv/log(0.01)))

       csig=-mgv/log(0.01);

    end

    if (csig<0.000002)

       csig=0.000002;

        end

        gvals(1:tlen)=exp(-(gvals(1:tlen)-t_val).^2/csig);

        gvals(1:tlen)=gvals(1:tlen)/sum(gvals(1:tlen));

        vals(len-tlen+1:len)=-gvals(1:tlen);

      end

      len=len+1;

      row_inds(len)= consts_len;

      col_inds(len)=indsM(i,j);

      vals(len)=1; 

   end

end

vals=vals(1:len);

col_inds=col_inds(1:len);

row_inds=row_inds(1:len);

A=sparse(row_inds,col_inds,vals,consts_len,imgSize);

b=zeros(size(A,1),1);

for t=2:3

    curIm=ntscIm(:,:,t);

    b(lblInds)=curIm(lblInds);

    new_vals=A\b;

    nI(:,:,t)=reshape(new_vals,n,m,1);

end

snI=nI;

nI=ntsc2rgb(nI);

机器学习：Colorization using Optimization的更多相关文章

吴恩达机器学习笔记47-K均值算法的优化目标、随机初始化与聚类数量的选择（Optimization Objective & Random Initialization & Choosing the Number of Clusters of K-Means Algorithm）
一.K均值算法的优化目标 K-均值最小化问题,是要最小化所有的数据点与其所关联的聚类中心点之间的距离之和,因此 K-均值的代价函数(又称畸变函数 Distortion function)为: 其中
吴恩达机器学习笔记41-支持向量机的优化目标（Optimization Objective of Support Vector Machines）
【机器学习Machine Learning】资料大全
昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machi ...
机器学习——支持向量机(SVM)之拉格朗日乘子法，KKT条件以及简化版SMO算法分析
SVM有很多实现,现在只关注其中最流行的一种实现,即序列最小优化(Sequential Minimal Optimization,SMO)算法,然后介绍如何使用一种核函数(kernel)的方式将SVM ...
【转】自学成才秘籍！机器学习&深度学习经典资料汇总
小编都深深的震惊了,到底是谁那么好整理了那么多干货性的书籍.小编对此人表示崇高的敬意,小编不是文章的生产者,只是文章的搬运工. <Brief History of Machine Learn ...
paper 127：机器学习中的范数规则化之（二）核范数与规则项参数选择
机器学习中的范数规则化之(二)核范数与规则项参数选择 zouxy09@qq.com http://blog.csdn.net/zouxy09 上一篇博文,我们聊到了L0,L1和L2范数,这篇我们絮叨絮 ...
《Spark 官方文档》机器学习库（MLlib）指南
spark-2.0.2 机器学习库(MLlib)指南 MLlib是Spark的机器学习(ML)库.旨在简化机器学习的工程实践工作,并方便扩展到更大规模.MLlib由一些通用的学习算法和工具组成,包括分 ...
Shogun网站上的关于主流机器学习工具包的比较
Shogun网站上的关于主流机器学习工具包的比较: http://www.shogun-toolbox.org/page/features/ created last updated main l ...
用ADMM求解大型机器学习问题
[本文链接:http://www.cnblogs.com/breezedeus/p/3496819.html,转载请注明出处] 从等式约束的最小化问题说起: ...

随机推荐

java 开发环境安装
一.在mac上安装jdk 1. 下载Mac版本的JDK并安装 http://www.oracle.com/technetwork/java/javase/downloads/index.ht ...
数据结构（Java语言）——Stack简单实现
栈是限制插入和删除仅仅能在一个位置上进行的表.该位置是表的末端,叫做栈的顶top.对栈的基本操作有进栈push和出栈pop,前者相当于插入.后者这是删除最后插入的元素. 栈有时又叫先进先出FIFO表. ...
client交互技术简单介绍
随着网络应用的不断丰富,client交互技术也如雨后春笋一般,遍地开花. 正是这些技术的支持,我们的互联网世界变得更加丰富多彩.一个浏览器上.不用说是简单的动画效果,就是一个Office应用也能顺畅的 ...
数据挖掘之pandas
sdata={'语文':89,'数学':96,'音乐':39,'英语':78,'化学':88} #字典向Series转化 @@ >>> studata=Series(sdata) & ...
items" does not support runtime expression
<%@taglib prefix="c" uri="http://java.sun.com/jstl/core"%> 更改为 <%@tagl ...
模拟struts2
利用到的技术:dom4j和xpath 自己写一个Filter 在doFilter中拦截请求 // 2.1 得到请求资源路径 String uri = request.getReq ...
Linux下服务端口被占用
有一次,在启动ejabberd的时候,报错如下: 10:30:15 =CRASH REPORT==== crasher: initial call: supervisor:ejabberd_liste ...
九度OJ 1169：比较奇偶数个数（基础题）
时间限制:1 秒内存限制:32 兆特殊判题:否提交:9459 解决:3146 题目描述: 第一行输入一个数,为n,第二行输入n个数,这n个数中,如果偶数比奇数多,输出NO,否则输出YES. 输入 ...
Software-defined networking
Software-defined networking administrators to programmatically initialize, control, change, and mana ...
【模板】区间第k小
[模板]区间第k小我实在是太弱了现在才会这个东西QAQ. 主席树做法. 一张关于主席树的无字说明线段树\(2\)是只单点修改了实心酒红色点的线段树\(2\),线段树\(2\)中的蓝色节点实际上就是 ...

机器学习：Colorization using Optimization

机器学习：Colorization using Optimization的更多相关文章

随机推荐

热门专题