Lens:口袋中的扫描仪" title="Office Lens:口袋中的扫描仪">

编者按:开会时,你是否觉得白板上天马行空的讨论记录誊抄起来费时费事又难以共享……Office
Lens将结束这一切,带给你一种全新的获取和储存信息的方式!只需用手机拍一张照片,Office
Lens会自动对图像进行校正和清理并把它保存到OneNote,更可以将图片上的文字转存为文字。

来源:Office Lens Is a Snap

当移动手机的生厂商给他们的手机设备装上摄像头时,这些手机已经不仅仅是手机了。轻巧的手机自带相机不仅让日常摄影变得简单,它们也已经改变了我们记录生活的方式。现在,在微软研究院的帮助下,微软Office团队研发了基于Windows
Phone 8手机系统
Office
Lens相机应用
,这将从另一个侧面改变我们记录生活的方式。

现可通过Windows
Phone应用商店
免费下载安装的Office Lens,是首批使用全新OneNote Service
API
技术的应用,将带来全新获取和储存信息的方式。Office
Lens是一个很容易上手的应用:用手机拍摄获取一个文件或白板的照片,随后上传图片到OneNote,把图片储存到云端。如果上传的图片里有文字,OneNote中基于云端的光学字符识别软件(optical
character-recognition ,OCR)将把它转换成可编辑、可搜索的文字。Office
Lens就像是你随身携带的扫描仪,你可能拍下菜单、名片或是白板 ,Office
Lens提升了照片的品质并把它放到你的OneNote快速记事本中,你可以在OneNote中阅读或分享这些信息。现在,OneNote已经可以免费下载了。

光学字符识别软件(optical
character-recognition
,OCR)识别字符的准确性取决于被扫描的图片的质量。与使用台式扫描仪来扫描文件相比,用户通过手机摄像头来拍摄文件时遇到的情况更加多样化。Office
Lens的用户可以从任意角度拍摄获取照片,并且这些照片可能会曝光不足或过度、比较模糊,或者受到白板表面的反射光的影响。为了更好地解决这些用户可能面临的问题,Office产品团队将与微软研究院合作,共同改进
Office Lens。

“我们必须把软件变得更易于使用。”Office的首席项目经理Chris Yu表示,“在照片被上传到OneNote进行储存和文字转换之前,Office
Lens会自动对手机上的图片进行校正和清理。也就是说,你只用手机拍一张照片,Office
Lens会自动对图像进行清理并把它保存到OneNote,而OneNote中基于云端的光学字符识别软件(optical character-recognition
,OCR)将对图片进行文字识别,随后你就可以拥有一个可编辑、可搜索的数字文件。通常Office
Lens将会自动检测文档或白板的边缘,当然你也可以根据自己的需求来选择手动设置边框。

 

从白板到光学字符识别

Office
Lens的想法起源于一个被称为“Whiteboard
It
”的研究项目。Whiteboard (白板)
结合了高效、经济、形式自由等特点,但是他们的内容很难存档,并且难以跟不在场的其他同事分享。

与此同时,在技术层面上,在白板图片的高质拍摄和数据转化上所面临挑战尤为严峻。关于这个问题,来自微软研究院多媒体、互动和传播组的首席研究员和研究经理张正友为我们提供了解决这一问题的良方。

Whiteboard
It最初是张正友和研究工程师Li-wei
He
的合作研究项目。他说道,“我们的最终目的是把白板的内容重现,生成既忠实于原图但质量又有所提升的电子文档。”

Whiteboard
It项目中的主要挑战包括:如何补偿用户从某一侧面角度拍摄照片时可能出现的透视失真、如何对白板边界进行边缘检测、如何通过白平衡实现均匀的白色背景和强色彩饱和度的笔迹。如果需要得到清晰的能被任何Office文档整合的照片,这些甚至更多问题必须得到解决。

PD
Singh是微软研究院和微软Office产品组的联络人,Chris Yu从高级研究项目经理PD Singh那里了解到Whiteboard It项目。

正友回忆道,“Chris的团队在对我们的代码进行测试后就迅速开始致力于把代码整合到Office
Lens的工作中。他的团队在日本,所以我们进行了不少在线会议,也在雷德蒙研究院有一些面对面的交谈,进行案例分析和头脑风暴,希望找到解决方法。”

正友对Chris的团队印象深刻,他说:“虽然Whiteboard It是Office
Lens的核心技术,但它也只是整个产品的一个部分。比如Office
Lens产品团队需要尽可能为广大公众提供最佳用户体验,这个过程包括了很多工作思考、设计、测试。他们进行观察后提出,如果白板的照片里恰好有个人像,要如何把这个人从公式中去除。而我们的技术原型并没有关于这方面的考量,对于这些,我一直印象深刻。”

而这次合作也给Chris留下了深刻印象,他说:“正友很多年前就开始设想研发Whiteboard
It,他看到了人们对提升网络会议质量的需求。网络摄像头变得经济实惠,这为满足人们的需求提供了后备支撑。如今,设备技术和云端都进一步发展进化,给他的工作提供了新的技术背景。我们很高兴能和他一起把他的想法变成现实!”

Lens:口袋中的扫描仪" title="Office Lens:口袋中的扫描仪">

从高质量照片开始

Office
Lens还采用了来自高级图片编辑器Advanced
Image Editor (AIE)的算法,这是来自微软亚洲研究院视觉计算组袁路和他的同事们(包括首席研究员孙剑、 研发工程师刘江宇和研究员何恺明)的项目,AIE集合了一系列改善用户照片质量的技术。

袁路介绍道:“AIE的主要目标是提供一个平台和用户界面,更容易地把我们的核心科技展示给产品团队。此外,
AIE帮助我们从内部用户和产品团队处得到用户反馈,这些反馈将进一步改善我们的技术,激发我们的新想法。事实上,是AIE让我们得以把我们的高级图片处理算法介绍给Office产品团队。”

试用AIE的一周内,Office的一个产品团队与袁路接触,给予了反馈,讨论了一些他们使用案例的特点。袁路和他的同事刘江宇与产品开发团队紧密合作,对算法和代码进行整合。随后进入第二阶段的合作——测试和改进代码。最后,这些代码成为了2013年11月发布的Windows8.1系统中OneNote的相机扫描(Camera
Scan
)的一部分,它们实现了对文档和白板的自动旋转、矫直、裁剪、锐化和阴影去除,帮助改进了原有的图像捕捉功能。

袁路说道:“我们与Office
Lens团队保持合作 ,贡献了我们最新的研究成果来帮助他们执行代码。”

Office
Lens会自动运用一些主要的改善图像的算法来修正图像色调和曝光、提高对比度、减少“噪音”。这听起来像是对Camera
Scan的复制,但无论是对于Office
Lens的产品团队还是研究团队而言,在移动设备上实现这些图像处理功能本身就是一个巨大挑战。

天作之合

谈及与产品团队的合作,袁路表示:“那是非常振奋人心的!它给了我们激情和动力,开放的对话让我们更好地理解是什么造就了更好的用户体验。我们希望发展计算摄影技术,以期为用户提供高质量的照片。所以我们的研究目标与Office
Lens的目标完全一致。”

正友也感叹道:“Chris团队的效率让我印象十分深刻,他们工作勤奋、乐于提建议,我们之间的合作非常顺利。Whiteboard
It技术的产品化让我非常欣喜,我非常感谢Office Lens产品团队。我相信Office
Lens这个应用一定能帮助用户提高工作效率,并且促进合作分享。”

从产品团队的角度,Chris也非常激动:“与微软研究院一起为Office
Lens努力,这次合作简直是天作之合。微软研究院在提升图像质量方面积累了丰厚的专业知识,比如我们可以向Neel JoshiSebastian
Nowozin
询问关于模糊测量的问题,与Piotr Dollar讨论边缘检测。”

那么,早期用户关于Office
Lens都有什么看法呢?

Chris介绍道:“早期用户的反馈很积极,他们认为这节省了很多时间,改变了做笔记的方式。现在,他们只要给文件拍一张照片,就能在OneNote云端找到对应文件。我想,没有微软研究院,我们一定难以实现这些想法。”


____________________________________________________________________________________ 

相关阅读

手机遥控Office,变身演讲达人


欢迎关注


微软亚洲研究院人人网主页:
http://page.renren.com/600674137


微软亚洲研究院微博:
http://t.sina.com.cn/msra

Office Lens:口袋中的扫描仪的更多相关文章

  1. 微软正开发Office Reader和Office Lens

    据熟知微软Office计划的消息人士透露,微软目前正开发新Windows 8风格的Office应用程序,该应用程序代号被微软称为Office Reader,而为Windows Phone开发的应用程序 ...

  2. 【原创】你知道OneNote的OCR功能吗?office lens为其增大威力,中文也识别

    OneNote提供了强大的从图片中取出文字的功能,大家只要装上了桌面版OneNote(本人用的2013版和win8.1版测试的,其他版本为测),将图片放在OneNote笔记中,右键图片即可把图片中的文 ...

  3. 你知道OneNote的OCR功能吗?office lens为其增大威力,中文也识别

    原文:[原创]你知道OneNote的OCR功能吗?office lens为其增大威力,中文也识别 OneNote提供了强大的从图片中取出文字的功能,大家只要装上了桌面版OneNote(本人用的2013 ...

  4. Office word 2013中直接调用MathType的方法

    Office word 2013中直接调用MathType的方法 | 浏览:4403 | 更新:2014-02-20 14:45 | 标签: word 使用Office word 2013的用户肯定早 ...

  5. VSTO 向office文档中插入内容

    原文:VSTO 向office文档中插入内容 Word: Word.Selection sec = ThisAddIn.appWord.Selection;            sec.Insert ...

  6. Python在Office 365 开发中的应用

    我在昨天发布的文章 -- 简明 Python 教程:人生苦短,快用Python -- 中提到了Python已经在Office 365开发中全面受支持,有不同朋友留言或私信说想了解更加详细的说明,所以特 ...

  7. 【.net 深呼吸】导出 Office 文档中的图片

    我们常用的 Office 文档其实就三种——Word.Excel.PowerPoint,分别对应的扩展名为:.docx..pptx..xlsx. 许多教程都告诉我们,要提取这些文件中的图片(其实像视频 ...

  8. VBA Dumper v0.1.4.2, 提取office文档中的VBA代码,监查宏病毒恢复代码(演示版

    http://club.excelhome.net/thread-970051-1-1.html VBA Dumper 0.1.4.2更新,填补国内同类程序空白 此程序为演示版,可以在无office的 ...

  9. python、java、ruby、node等如何提取office文档中的内容?

    我相信大家都有过这样的需求,把doc.ppt.excel.pdf.txt中的文本内容提取出来.提取出来的文本内容可用于文档内容的全文索引,文档的基本内容摘要等.在度娘上搜索“如何提取文档内容”,确实有 ...

随机推荐

  1. Python 安装gevent,在导入gevent之后就报错了

    错误信息如下 RuntimeWarning: greenlet.greenlet size changed, may indicate binary incompatibility. Expected ...

  2. android机器时间不同步导致网络请求出错

    转自: https://blog.csdn.net/DeMonliuhui/article/details/82226601 获取网页时间代替系统时间 根据下列代码,我们就可以获取任何一个网址的时间( ...

  3. SQL注入——报错注入

    0x00 背景 SQL注入长期位于OWASP TOP10 榜首,对Web 安全有着很大的影响,黑客们往往在注入过程中根据错误回显进行判断,但是现在非常多的Web程序没有正常的错误回显,这样就需要我们利 ...

  4. Cookie的作用范围、设置、创建、获取的方法

    cookie的作用范围 同一浏览器,同一路径 默认情况下, 上级目录设置的cookie,下级目录可以获取到, 而下级目录设置的cookie,上级目录不能获取. 即:在一个页面设置cookie,那么这个 ...

  5. 21. docker 数据通讯环境准备

    一 . 环境搭建 1.编写 Vagrantfile 并创建虚拟机 并虚拟机host绑定外部 192.168.205.10:8888 # -*- mode: ruby -*- # vi: set ft= ...

  6. dotnet core 禁用https

    1,在  Properties\launchSettings.json 中的applicationUrl删除 https的选项  2,在Startup.cs中注释掉  app.UseHttpsRedi ...

  7. 【MySQL参数】-innodb_additional_mem_pool_size

    原博客:https://yq.aliyun.com/articles/32384

  8. The mplot3d Toolkit

    简介 正如,pyplot模块被用来绘制二维图,matplotlib使用mplot3d模块绘制三维图形,在mplot3d模块中存在 mpl_toolkits.mplot3d.axes3dmpl_tool ...

  9. Java搭建WebSocket的两种方式

    下面分别介绍搭建方法:一.直接使用Java EE的api进行搭建.一共3个步骤:1.添加依赖<dependency>    <groupId>javax</groupId ...

  10. Akka Typed系列:协议&行为

    引言 2019年11月6号LightBend公司发布了AKKA 2.6版本,带来了类型安全的actor,新的Akka Cluster底层通信设施——Artery,带来了更好的稳定性,使用Jackson ...