Office Lens:口袋中的扫描仪
Lens:口袋中的扫描仪" title="Office Lens:口袋中的扫描仪">
编者按:开会时,你是否觉得白板上天马行空的讨论记录誊抄起来费时费事又难以共享……Office
Lens将结束这一切,带给你一种全新的获取和储存信息的方式!只需用手机拍一张照片,Office
Lens会自动对图像进行校正和清理并把它保存到OneNote,更可以将图片上的文字转存为文字。
当移动手机的生厂商给他们的手机设备装上摄像头时,这些手机已经不仅仅是手机了。轻巧的手机自带相机不仅让日常摄影变得简单,它们也已经改变了我们记录生活的方式。现在,在微软研究院的帮助下,微软Office团队研发了基于Windows
Phone 8手机系统的Office
Lens相机应用,这将从另一个侧面改变我们记录生活的方式。
现可通过Windows
Phone应用商店免费下载安装的Office Lens,是首批使用全新OneNote Service
API技术的应用,将带来全新获取和储存信息的方式。Office
Lens是一个很容易上手的应用:用手机拍摄获取一个文件或白板的照片,随后上传图片到OneNote,把图片储存到云端。如果上传的图片里有文字,OneNote中基于云端的光学字符识别软件(optical
character-recognition ,OCR)将把它转换成可编辑、可搜索的文字。Office
Lens就像是你随身携带的扫描仪,你可能拍下菜单、名片或是白板 ,Office
Lens提升了照片的品质并把它放到你的OneNote快速记事本中,你可以在OneNote中阅读或分享这些信息。现在,OneNote已经可以免费下载了。
光学字符识别软件(optical
character-recognition
,OCR)识别字符的准确性取决于被扫描的图片的质量。与使用台式扫描仪来扫描文件相比,用户通过手机摄像头来拍摄文件时遇到的情况更加多样化。Office
Lens的用户可以从任意角度拍摄获取照片,并且这些照片可能会曝光不足或过度、比较模糊,或者受到白板表面的反射光的影响。为了更好地解决这些用户可能面临的问题,Office产品团队将与微软研究院合作,共同改进
Office Lens。
“我们必须把软件变得更易于使用。”Office的首席项目经理Chris Yu表示,“在照片被上传到OneNote进行储存和文字转换之前,Office
Lens会自动对手机上的图片进行校正和清理。也就是说,你只用手机拍一张照片,Office
Lens会自动对图像进行清理并把它保存到OneNote,而OneNote中基于云端的光学字符识别软件(optical character-recognition
,OCR)将对图片进行文字识别,随后你就可以拥有一个可编辑、可搜索的数字文件。通常Office
Lens将会自动检测文档或白板的边缘,当然你也可以根据自己的需求来选择手动设置边框。
从白板到光学字符识别
Office
Lens的想法起源于一个被称为“Whiteboard
It”的研究项目。Whiteboard (白板)
结合了高效、经济、形式自由等特点,但是他们的内容很难存档,并且难以跟不在场的其他同事分享。
与此同时,在技术层面上,在白板图片的高质拍摄和数据转化上所面临挑战尤为严峻。关于这个问题,来自微软研究院多媒体、互动和传播组的首席研究员和研究经理张正友为我们提供了解决这一问题的良方。
Whiteboard
It最初是张正友和研究工程师Li-wei
He的合作研究项目。他说道,“我们的最终目的是把白板的内容重现,生成既忠实于原图但质量又有所提升的电子文档。”
Whiteboard
It项目中的主要挑战包括:如何补偿用户从某一侧面角度拍摄照片时可能出现的透视失真、如何对白板边界进行边缘检测、如何通过白平衡实现均匀的白色背景和强色彩饱和度的笔迹。如果需要得到清晰的能被任何Office文档整合的照片,这些甚至更多问题必须得到解决。
PD
Singh是微软研究院和微软Office产品组的联络人,Chris Yu从高级研究项目经理PD Singh那里了解到Whiteboard It项目。
正友回忆道,“Chris的团队在对我们的代码进行测试后就迅速开始致力于把代码整合到Office
Lens的工作中。他的团队在日本,所以我们进行了不少在线会议,也在雷德蒙研究院有一些面对面的交谈,进行案例分析和头脑风暴,希望找到解决方法。”
正友对Chris的团队印象深刻,他说:“虽然Whiteboard It是Office
Lens的核心技术,但它也只是整个产品的一个部分。比如Office
Lens产品团队需要尽可能为广大公众提供最佳用户体验,这个过程包括了很多工作思考、设计、测试。他们进行观察后提出,如果白板的照片里恰好有个人像,要如何把这个人从公式中去除。而我们的技术原型并没有关于这方面的考量,对于这些,我一直印象深刻。”
而这次合作也给Chris留下了深刻印象,他说:“正友很多年前就开始设想研发Whiteboard
It,他看到了人们对提升网络会议质量的需求。网络摄像头变得经济实惠,这为满足人们的需求提供了后备支撑。如今,设备技术和云端都进一步发展进化,给他的工作提供了新的技术背景。我们很高兴能和他一起把他的想法变成现实!”
Lens:口袋中的扫描仪" title="Office Lens:口袋中的扫描仪">
从高质量照片开始
Office
Lens还采用了来自高级图片编辑器Advanced
Image Editor (AIE)的算法,这是来自微软亚洲研究院视觉计算组的袁路和他的同事们(包括首席研究员孙剑、 研发工程师刘江宇和研究员何恺明)的项目,AIE集合了一系列改善用户照片质量的技术。
袁路介绍道:“AIE的主要目标是提供一个平台和用户界面,更容易地把我们的核心科技展示给产品团队。此外,
AIE帮助我们从内部用户和产品团队处得到用户反馈,这些反馈将进一步改善我们的技术,激发我们的新想法。事实上,是AIE让我们得以把我们的高级图片处理算法介绍给Office产品团队。”
试用AIE的一周内,Office的一个产品团队与袁路接触,给予了反馈,讨论了一些他们使用案例的特点。袁路和他的同事刘江宇与产品开发团队紧密合作,对算法和代码进行整合。随后进入第二阶段的合作——测试和改进代码。最后,这些代码成为了2013年11月发布的Windows8.1系统中OneNote的相机扫描(Camera
Scan)的一部分,它们实现了对文档和白板的自动旋转、矫直、裁剪、锐化和阴影去除,帮助改进了原有的图像捕捉功能。
袁路说道:“我们与Office
Lens团队保持合作 ,贡献了我们最新的研究成果来帮助他们执行代码。”
Office
Lens会自动运用一些主要的改善图像的算法来修正图像色调和曝光、提高对比度、减少“噪音”。这听起来像是对Camera
Scan的复制,但无论是对于Office
Lens的产品团队还是研究团队而言,在移动设备上实现这些图像处理功能本身就是一个巨大挑战。
天作之合
谈及与产品团队的合作,袁路表示:“那是非常振奋人心的!它给了我们激情和动力,开放的对话让我们更好地理解是什么造就了更好的用户体验。我们希望发展计算摄影技术,以期为用户提供高质量的照片。所以我们的研究目标与Office
Lens的目标完全一致。”
正友也感叹道:“Chris团队的效率让我印象十分深刻,他们工作勤奋、乐于提建议,我们之间的合作非常顺利。Whiteboard
It技术的产品化让我非常欣喜,我非常感谢Office Lens产品团队。我相信Office
Lens这个应用一定能帮助用户提高工作效率,并且促进合作分享。”
从产品团队的角度,Chris也非常激动:“与微软研究院一起为Office
Lens努力,这次合作简直是天作之合。微软研究院在提升图像质量方面积累了丰厚的专业知识,比如我们可以向Neel Joshi和Sebastian
Nowozin询问关于模糊测量的问题,与Piotr Dollar讨论边缘检测。”
那么,早期用户关于Office
Lens都有什么看法呢?
Chris介绍道:“早期用户的反馈很积极,他们认为这节省了很多时间,改变了做笔记的方式。现在,他们只要给文件拍一张照片,就能在OneNote云端找到对应文件。我想,没有微软研究院,我们一定难以实现这些想法。”
____________________________________________________________________________________
相关阅读
Office Lens:口袋中的扫描仪的更多相关文章
- 微软正开发Office Reader和Office Lens
据熟知微软Office计划的消息人士透露,微软目前正开发新Windows 8风格的Office应用程序,该应用程序代号被微软称为Office Reader,而为Windows Phone开发的应用程序 ...
- 【原创】你知道OneNote的OCR功能吗?office lens为其增大威力,中文也识别
OneNote提供了强大的从图片中取出文字的功能,大家只要装上了桌面版OneNote(本人用的2013版和win8.1版测试的,其他版本为测),将图片放在OneNote笔记中,右键图片即可把图片中的文 ...
- 你知道OneNote的OCR功能吗?office lens为其增大威力,中文也识别
原文:[原创]你知道OneNote的OCR功能吗?office lens为其增大威力,中文也识别 OneNote提供了强大的从图片中取出文字的功能,大家只要装上了桌面版OneNote(本人用的2013 ...
- Office word 2013中直接调用MathType的方法
Office word 2013中直接调用MathType的方法 | 浏览:4403 | 更新:2014-02-20 14:45 | 标签: word 使用Office word 2013的用户肯定早 ...
- VSTO 向office文档中插入内容
原文:VSTO 向office文档中插入内容 Word: Word.Selection sec = ThisAddIn.appWord.Selection; sec.Insert ...
- Python在Office 365 开发中的应用
我在昨天发布的文章 -- 简明 Python 教程:人生苦短,快用Python -- 中提到了Python已经在Office 365开发中全面受支持,有不同朋友留言或私信说想了解更加详细的说明,所以特 ...
- 【.net 深呼吸】导出 Office 文档中的图片
我们常用的 Office 文档其实就三种——Word.Excel.PowerPoint,分别对应的扩展名为:.docx..pptx..xlsx. 许多教程都告诉我们,要提取这些文件中的图片(其实像视频 ...
- VBA Dumper v0.1.4.2, 提取office文档中的VBA代码,监查宏病毒恢复代码(演示版
http://club.excelhome.net/thread-970051-1-1.html VBA Dumper 0.1.4.2更新,填补国内同类程序空白 此程序为演示版,可以在无office的 ...
- python、java、ruby、node等如何提取office文档中的内容?
我相信大家都有过这样的需求,把doc.ppt.excel.pdf.txt中的文本内容提取出来.提取出来的文本内容可用于文档内容的全文索引,文档的基本内容摘要等.在度娘上搜索“如何提取文档内容”,确实有 ...
随机推荐
- 吴裕雄--天生自然 JAVASCRIPT开发学习: 闭包
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...
- delphi try except与try finally语句用法以及区别
一.异常的来源 在Delphi的应用程序中,下列的情况都比较有可能产生异常. (1)文件处理 (2)内存分配 (3)Windows资源 (4)运行时创建对象和窗体 (5)硬件和操作系统冲突 二.异常的 ...
- 2020年使用Delphi的25个理由(我觉得四个优点:控件+可视化开发+跨平台+数据库,还有一个编译快,运行快)——人生苦短,我用Delphi!
25年后从10个使用Delphi的理由到1个至25个使用Delphi 10.3的理由 25年前发布Delphi 1时,我汇总了使用Delphi的十大理由.这是我精通Delphi原始书的序言中的原始列表 ...
- java笔记——手写+键入
Frame.setDefaultCloseOpreation() Default:默认的 设置默认关闭操作 (0:什么都不干: 1:隐藏窗口: 2:关闭窗口但继续运行程序: 3:关闭窗口关闭程序:) ...
- [De1CTF 2019]SSRF Me-MD5长度扩展攻击&CVE-2019-9948
0x00 打开题目查看源代码,开始审计 这里贴上网上师傅的博客笔记: https://xz.aliyun.com/t/6050 #! /usr/bin/env python #encoding=utf ...
- 通过geopandas.sjoin()函数按多边形范围分割点
最近有一批点和多变型的数据,需要将点按照多边形的区域进行分割. 经过若干尝试,终于通过geopandas的sjoin函数得以实现. 这里首先感谢博主“张da统帅”的分享,使得本人获得该实现方法的灵感, ...
- MYSQL8用户创建及权限操作
MYSQL8创建.删除用户和授权.消权操作 上网找过资料说要进入mysql数据库在进行这些操作,我试了发现不进数据库和进入mysql数据库效果都一样 网上有的直接创建并赋权,像酱紫的: grant a ...
- Docker部署freeswitch
1. clone配置文件到本地服务器 git clone https://github.com/BetterVoice/freeswitch-container.git 相关Dockerfile如下: ...
- The flower(寻找出现m次以上,长度为k的子串)
链接:https://ac.nowcoder.com/acm/contest/3665/B来源:牛客网 题目描述 Every problem maker has a flower in their h ...
- php开启opcache
OPcache 通过将 PHP 脚本预编译的字节码存储到共享内存中来提升 PHP 的性能, 存储预编译字节码的好处就是 省去了每次加载和解析 PHP 脚本的开销. 一.php.ini配置opchche ...