Asia 2014精彩入选论文赏析" title="探索真实事物的虚拟再现——微软亚洲研究院SIGGRAPH Asia 2014精彩入选论文赏析">

SIGGRAPH
Asia
今年首次来到内地,于12月3日在深圳国际会议中心开幕。此次,微软亚洲研究院共有七篇论文入选此次大会,研究员们也会大会现场进行演讲和项目演示。在这里,我们特别挑选了三篇精彩的入选论文,和大家分享一下论文背后的技术设想。他们的共同关注点都是如何利用设备更好地捕捉和呈现现实中的人物和场景,但是每一篇论文的项目都有独特的切入点。

Dynamic Hair Capture using
Spacetime Optimization

动作大片中常常会出现这样一个场景,长发飘飘的女神从高楼或飞机上坠落,这时候超级英雄就会突然出现在半空中英雄救美。如此刺激而唯美的画面难道真要好莱坞的大牌们亲自冒险拍摄吗?坠落过程中女神那一头飘逸的秀发又是怎么形成的呢?
第一篇论文所研究的项目正是与此相关的。

Asia 2014精彩入选论文赏析" title="探索真实事物的虚拟再现——微软亚洲研究院SIGGRAPH Asia 2014精彩入选论文赏析">

该技术主要内容可简单概括成头发动态运动的捕捉和三维重建。具体来说,即通过从不同角度拍摄头发在真实场景中的运动视频,在计算机中重建发丝级别的动态三维头发模型。

对于运动中的头发的三维模型重建是极其具有挑战性的。人的头发由超过10万根纤细的发丝组成,这些发丝相互遮挡,大部分从外部根本不可见。而在运动中由碰撞、摩擦等引起的发丝间的相互作用更是错综复杂。

之前一些类似的研究简单地将静态头发重建的方法推广到动态,因为没有充分利用时间上的信息,重建的结果一直都不尽如人意。整个项目的研究过程长达一年多,中途尝试过不少方法,却没有任何突破的结果,因为所拍头发运动视频的帧与帧之间,很难对每根头发进行准确地跟踪。但是最终,研究员们想出了解决办法。他们将头发运动视频看作由每帧画面重叠而成的立方体,发现在这个立方体的水平(或竖直)切面上,发丝的运动会留下清晰的轨迹。这些轨迹可以通过特殊的图像算法自动抽取,结合不同拍摄角度的视频,使得对头发运动的捕捉更准确,更稳定。

对于这项技术的应用场景,研究员表示,头发的运动捕捉和动态三维模型重建将会是未来高质量全人体(full-body)动态重建不可缺少的部分。在电影制作中,根据演员重建的高质量模型使得后期可以随意改变角色所处的场景,光照,甚至拍摄角度。此外,我们方法生成的动态三位头发模型不仅外观和运动与原始视频相符,每根发丝还具有相当程度的真实物理特性,如发根固定在头皮上,长度保持不变等。这使得后期有可能对头发的样式和运动做进一步的编辑(将直发变为卷发,使运动更平滑等等)。最后,这些根据真实头发重建的数据可以帮助研究人员进一步学习和了解头发的运动,甚至用于开发数据驱动的头发运动模拟算法。

Fast Burst Images
Denoising

现如今几乎所有的最新型手机都增加了连拍照相功能,让用户可以捕捉每一个精彩瞬间。这项功能同时也能为低光照下拍摄高质量照片提供可能。由于光线较暗的时候,照片往往不是出现噪点,就是出现模糊,不易拍摄出高质量的照片。这篇论文主要研究的问题是如何利用手机或相机的连拍方式,去除照片中出现的噪点和模糊,以对照片质量进行优化。

Asia 2014精彩入选论文赏析" title="探索真实事物的虚拟再现——微软亚洲研究院SIGGRAPH Asia 2014精彩入选论文赏析">

原来的大部分去噪点研究中,所利用的都是一张图片,那么考虑空间上的相似关系,可利用的所有信息也只能来自于那一张特定的图片。当信噪比相对较低的时候,系统根本无法区分噪声和原有的图像信号。但是如今运用多张图片就可以很容易解决这个问题。由于连拍的图片在时间域上有很强的相关性,即使在信号弱的时候,让图片之间彼此空间对齐后,在时间轴上相加,噪点的分布便可以变成零均值,从而达到去除噪声的目的。然而,之前已有研究对“多张图多张出”
和“多张图一张出”都有涉足,但是一直无法找出一种方法,能快速实现图片去噪点同时保证高质量输出的优化目标。另外,在连拍过程中,往往会因为手的抖动或者是拍摄目标的运动而导致每张照片的内容并不是对齐的,这也给去噪的目标带来相当大的难度。

之前的运动估计通常依靠光流(逐点运功估计)或者块匹配(常用于视频压缩的运动估计)的方式。然而它们的计算非常耗时,并且结果容易受到噪声的影响。研究员们对相机运动和被拍摄物体运动进行了拆分计算。首先,他们将相机的运动参数化,建立出一个参数模型,从而能非常快的估计出具体运动的相关参数。而针对场景中的物体运动,他们则对每一帧的具体运动进行了分析,针对运动的快慢,算法都能相应地估计出运动物体的精确轮廓。在每个像素时间轴上相加平均的时候,那些位于运动物体轮廓区域的像素都会被排除掉。通过这种简单的方式,他们能有效的解决图片每个像素对齐的问题。除此之外,他们进一步考虑空间上信息相关性,建立了一个多尺度“金字塔”结构,根据图像结构(例如,平滑区域和边缘)的分析,自适应的选择相应的平滑策略,从而达到进一步去除残留噪声的目的。最终,他们的算法将时间轴和空间轴结合在一起,在校正了每一帧的运动之后,得到的便是一幅清晰的图像。

该研究相对于之前许多类似研究来说,在时间和质量上都有了很大的提高。与之前的研究相比,这个研究的项目在保证画面高质量的同时,在速度上比之前提高了100至1000倍,即在电脑上处理10张5MB的图片少于1秒种。

另外,该项目的技术已经在Windows Phone的Blink应用上得到了运用。

Appearance-from-Motion:
Recovering Spatially Varying Surface Reflectance under Unknown
Lighting

如果在游戏中驾驶着法拉利最高配置赛车在赛道上飞驰,是不是很酷炫呢?目前大部分游戏中的道具都是艺术家绘制出来的,虽然有很高的仿真度,但是并非真实的画面。若能将游戏中驾驶的赛车变成与现实中的原型一模一样,那么游戏体验必定会增加不算少。而在这篇论文的项目所研究的正是这个问题。

Asia 2014精彩入选论文赏析" title="探索真实事物的虚拟再现——微软亚洲研究院SIGGRAPH Asia 2014精彩入选论文赏析">

该项目的主要内容是在已知物体几何形状的情况下,通过对物体在自然光照下运动的采集,让计算机对识别出其材质属性参数,进而在任意光照下重建出该物体。

重建的过程主要可以分成采集和渲染两部分。采集主要指对实物在单一光照下(实验室灯光或单一固定自然光照)运动中对光反射的采集,一般会用相机进行照片和视频的拍摄。渲染则指代采集过后在计算机上进行模型绘制的过程。由于材质不同,物体对光会呈现不一样的反射表现。比如塑料、金属和镜面,因为材质导致光滑程度不一样,在同样情况的光照下,塑料对光的反射是最模糊的,而镜面由于表面十分光滑,对光照的反射是最强烈的,金属则居中。根据物体上的每一点对光照的反射情况,可以计算出其材质属性(得出该点的材质属性公式)。在得到物体材质属性之后,我们就可以得到在任意光源之下的反射效果。

和过去的研究相比,这个项目体现出了明显的先进性。过去,如果制作出一个物体在不同光照下的模型,研究者们可能需要在不同光照对物体运动进行捕捉,整个采集过程十分繁琐。而如今这项研究实现了在未知的自然光照条件下一次采集便可完成对多种光照下不同材质光反射的虚拟还原。

这项技术的研究员在谈及该技术未来的运用方向时提出,它将主要被运用在电影和游戏中,将场景中的物体变得更为真实自然,例如游戏中玩家驾驶的汽车。这样可以解决一些如今主要靠艺术家去画而存在的局限,也可以让游戏和电影更让人有身临其境的感觉。

入选SIGGRAPH Asia的其他四篇论文

相关阅读

跨越真空与虚拟世界的边界——走近SIGGRAPH 2014大会

从CVPR 2014年计算机视觉领域的最新热点

史无前例的KDD 2014大会


欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

探索真实事物的虚拟再现——微软亚洲研究院SIGGRAPH Asia 2014精彩入选论文赏析的更多相关文章

  1. Ta说:2016微软亚洲研究院第二届博士生论坛

    ​ "聚合多元人才创造无尽可能,让每一位优秀博士生得到发声成长机会"可以说是这次微软亚洲研究院博士生论坛最好的归纳了.自去年首次举办以来,这项旨在助力青年研究者成长的项目迅速得到了 ...

  2. 解密优秀博士成长史 ——微软亚洲研究院首届博士生学术论坛Panel讨论经验总结

    编者按:有人说“一入博门深似海”,读博前应该做好哪些准备?作为一名博士生,应该有怎样的学术或职业规划?导师还是老板?怎样在师生关系上做到双赢?你是导师心目中优秀的博士生吗?相信以上问题在很多同学心中萦 ...

  3. 解密优秀博士成长史 ——微软亚洲研究院首届博士生学术论坛Panel讨论经验总结

    --微软亚洲研究院首届博士生学术论坛Panel讨论经验总结" title="解密优秀博士成长史 --微软亚洲研究院首届博士生学术论坛Panel讨论经验总结"> 编者 ...

  4. 科研伴我成长——上海交通大学ACM班学生在微软亚洲研究院的幸福实习生活

    每一年,微软亚洲研究院都会迎来一批"特殊的"实习生--他们既不是从五湖四海汇聚而来,也不是在读的硕士和博士.他们相识已久,知道对方的小秘密.小八卦,也相互敬佩.惺惺相惜--他们就是 ...

  5. 在中国实现自我价值的英国研究员——微软亚洲研究院英国籍研究员Darren的7年之路

    "我和妻子在这儿已经待了7年了,这里的一切都很棒,无论是微软亚洲研究院还是北京."Darren笑着说,似乎他和中国,和北京,和研究院一直停留在"蜜月期",并未曾 ...

  6. Offer垂青于有准备的人——微软亚洲研究院实习生们的就业分享

    编者按:一年一度的"求职大战"又拉开了序幕,如何在求职中掌握主动,更好地展现自己,最后抓住Offer?且听微软亚洲研究院三位实习生慢慢道来,Offer总会垂青于有准备的人. 廖振, ...

  7. 接轨国际,碰撞更多科研火花——第八届ChinaSys大会专访微软亚洲研究院首席研究员张霖涛

    作者:微软亚洲研究院实习生 徐祎雪 卢思奇 2015年6月5日至6日,由中国科学院深圳先进技术研究院先进计算与数字工程研究所主办的第八届中国计算机系统(ChinaSys)学术研讨会在厦门大学召开.来自 ...

  8. 微软亚洲研究院开源图数据库GraphView

    我们很高兴地宣布,由微软亚洲研究院系统算法组开发的图数据库GraphView通过GitHub平台开源.GraphView是一款中间件软件,方便用户使用关系数据库SQL Server 或Azure SQ ...

  9. 微软亚洲研究院的“哈利·波特”:Thomas Moscibroda

    在微软亚洲研究院,有一位名为Thomas Moscibroda的研究员几乎是无人不知.无人不晓,江湖人送外号"哈利·波特".Thomas认为他这么"红"是因为他 ...

随机推荐

  1. Python实现Collatz序列(考拉兹猜想)

    考拉兹猜想(英语:Collatz conjecture),又称为奇偶归一猜想.3n+1猜想.冰雹猜想.角谷猜想.哈塞猜想.乌拉姆猜想或叙拉古猜想,是指对于每一个正整数,如果它是奇数,则对它乘3再加1, ...

  2. 84.常用的返回QuerySet对象的方法使用详解:select_related, prefetch_related

    1.select_related: 只能用在一对多或者是一对一的关联模型之间,不能用在多对多或者是多对一的关联模型间,比如可以提前获取文章的作者,但是不能通过作者获取作者的文章,或者是通过某篇文章获取 ...

  3. goweb-动作

    go-模板引擎 动作 Go 模板的动作就是一些嵌入到模板里面的命令,这些命令在模板中需要放到两个 大括号里{{ 动作 }},之前我们已经用过一个很重要的动作:点(.),它代表了传递给模 板的数据.下面 ...

  4. UML-从需求到设计--迭代进化

    按照UP原则,初始阶段做10%的需求,而细化阶段开始为这10%的需求设计解决方案.后续章节介绍如何设计.

  5. Xpath编码问题解决

    使用Xpath获取属性时,出现乱码问题,解决办法找了好多,终于解决,特将办法贴在这,供大家尝试 不要直接简单的将爬取的网页设置为utf-8, 先通过print(r.encoding)输出看看爬取的是什 ...

  6. Django专题-form表单

    Form介绍 我们之前在HTML页面中利用form表单向后端提交数据时,都会写一些获取用户输入的标签并且用form标签把它们包起来. 与此同时我们在好多场景下都需要对用户的输入做校验,比如校验用户是否 ...

  7. 关于Linux下Oracle安装后启动的问题

    1.首先,切换成oracle用户,启动监听服务.(中间的横杠必须加上,不然会出现command not found 的错误) 命令1:su  -  oralce 命令2:lsnrctl start 参 ...

  8. LeetCode——542. 01 矩阵

    给定一个由 0 和 1 组成的矩阵,找出每个元素到最近的 0 的距离. 两个相邻元素间的距离为 1 . 示例 1: 输入: 0 0 0 0 1 0 0 0 0 输出: 0 0 0 0 1 0 0 0 ...

  9. column命令

    grep -E "car_flag|feaname" s_35926_uid_psi_table_20170407.csv | column -t -s, -o'|'

  10. node 配置文件

    # cat ~/.npmrc prefix=E:/Private/nodejs #registry=http://r.cnpmjs.org/ registry=http://registry.npm. ...