http://zhinengjiaohu.juhangye.com/201709/weixin_5664458.html

Siri之父Adam Cheyer认为,语音交互很可能是未来十年内计算技术的一个典型特征。与会分享的还有谷歌、亚马逊和微软虚拟助手产品的负责人。

Siri之父Adam Cheyer认为,语音交互很可能是未来十年内计算技术的一个典型特征。上周,在一次座谈会上,他分享了自己对人工智能助手未来发展的看法,座谈会上的嘉宾还有谷歌助手产品总监Gummi Hafsteinsson(也曾参与Siri的研究工作),亚马逊Alexa高级项目经理Ashwin Ram以及微软小娜产品团队主管Jordi Ribas。

  为何说Adam

Cheyer是Siri之父呢?这就不得不提到Siri的发展历程。Siri的技术最初源于一项科学研究——美国历史上最大型的人工智能项目CALO。该项目致力于打造一个可以学习的虚拟助手,项目结束后,研究员Adam
Cheyer与两个朋友朋友Dag Kittlaus和Chris
Brigham成立了一家公司,来开发Siri。直到2010年,Siri被苹果收购。此后,苹果于2011年发布Siri语音助理,并集成到iPhone
4S中,作为iOS移动操作系统的一部分。2012年Adam
Cheyer离开了苹果,创建了Viv实验室,致力于创建另一个AI虚拟助手,该实验室在2016年被三星以2.15亿美元的价格所收购。

  Adam

Cheyer说Viv实验室认为每隔10年左右的时间,人们的计算方式就会发生改变。在20世纪80年代,个人电脑站主导地位;20世纪90年代,网络开始占据主导地位;从2007年开始,移动设备蓬勃兴起;到现在也已经10年的时间了,因此Adam
Cheyer相信所有的关键技术都将迎来“巨大的飞跃”,而且这些技术很快就会在私人助理方面扮演重要的角色。

  他表示,所有的这些技术公司都投入了数十亿美元的资金,因此其中的利害关系自然可想而知,丝毫不亚于前几个十年发展的范例。他将范例定义为“每一个与之关联的商业都将会发生改变”,正如发生在iPhone、iPad和其他平板电脑及手机上的一样。而每一个关联用户也将在这个范例中投入大量的计算成本。当这一目标实现时——在未来两到三年是可行的——所有公司都在为此进行各种尝试。虽然我们还处在语音交互的早期,正如当初网络出现时并非交互式的一样,但我们可以看到语音交互这种技术已经浮出水面。

  这些东西会更智能吗?Adam Cheyer解释道:“当然,我认为我们目前所拥有的技术足以让我们进入下一个十年。我们每个人都有一个私人助理,借助扬声器、汽车和电话在网上做很多事情。”

  集成第三方服务

  关于整合或第三方生态系统,行业主要玩家都在利用各自的人工智能助手进行尝试。但正如前几次改变一样,只有少数赢家会主导这种改变,微软和英特尔带来了个人电脑,谷歌和亚马逊普及了网络,正如Cheyer所说,他希望未来只有少量虚拟助手规则,但能实现无缝授权访问第三方服务。

  “未来是否会只剩一种虚拟助手?你是否体验过具有高度定制的个性、名字和功能的虚拟助手?这两点在未来是十分有趣的,看虚拟助手市场如何优胜略汰。”Cheyer说道,“现在市面上虚拟助手实在太多了,我其实并不想记住汽车虚拟助手可以做什么,电视系统可以做什么,Alexa和微软小娜可以做什么,这样太麻烦了。我希望每个设备都只有一个通用的虚拟助手来访问所有的服务,其核心和第三方服务并没什么差别。”

  学会一起工作

  微软小娜产品团队的主管Ribas透露,自从微软与亚马逊合作后,Alexa可以和小娜彼此之间可以互相对话,微软似乎已经开始预测到AI助手未来发展的方向。

  “我认为我们与亚马逊在Alexa小娜的合作,在一定程度上都是对未来发展方向的一种押注,正如之前对网络发展的预测一样。现在亚马逊的Alexa可以说是购物的最佳助手,我们希望小娜是微软Office

365的最佳助手。”Ribas表示,“我认为每一个有代理商的公司都会使用第三方代理工具,他们也会对此进行专门的研究。时间是最好的证明,显然未来还有很多事情要发生,也有很长的路要走。”

  谷歌助理负责人Hafsteinsson补充道,包括谷歌在内的所有人,都在试图找出第三方应用程序的发展方向。

  “如果你看看所有的玩家,我认为我们都希望能让第三方开发者参与进来,但我们还没有找到一个完美的解决方案。所以我们的虚拟助手应用程序——小娜和Alexa有相近的功能。小娜和Alexa在一起工作,但我们都在试图弄清楚当产品涉及第三方服务时,什么样的交互会起作用。但这到底是怎么回事呢?”Hafsteinsson问道。

  “我认为我们还在尝试扩展。因为,从我的角度来看,虚拟助手必须保留用户体验,而且便于用户使用,这一切都是自然产生的,而不是刻意强求的。但要想在自然语言界面和所有这些服务之间架起桥梁仍是一个巨大的挑战。”

转:Siri之父:语音交互或将主导未来十年发展的更多相关文章

  1. 离线语音Snowboy热词唤醒+ 树莓派语音交互实现开关灯

    离线语音Snowboy热词唤醒 语音识别现在有非常广泛的应用场景,如手机的语音助手,智能音响(小爱,叮咚,天猫精灵...)等. 语音识别一般包含三个阶段:热词唤醒,语音录入,识别和逻辑控制阶段. 热词 ...

  2. ROS机器人语音交互(一)

    语音交互早期已经广泛应用在手机端,电脑端,随着技术的成熟,接口逐渐开放,ROS上老外搞的开源语音识别只支持英文,识别率还低. 国内语音识别技术已经相当成熟稳定.感谢ros小课堂的讲解,解决了自己的疑惑 ...

  3. SLAM+语音机器人DIY系列:(七)语音交互与自然语言处理——1.语音交互相关技术

    摘要 这一章将进入机器人语音交互的学习,让机器人能跟人进行语音对话交流.这是一件很酷的事情,本章将涉及到语音识别.语音合成.自然语言处理方面的知识.本章内容: 1.语音交互相关技术 2.机器人语音交互 ...

  4. 基于flask和百度AI接口实现前后端的语音交互

    话不多说,直接怼代码,有不懂的,可以留言 简单的实现,前后端的语音交互. import os from uuid import uuid4 from aip import AipSpeech from ...

  5. 曼孚科技:AI语音交互领域常用的4个术语

    ​语音交互是基于语音输入的新一代交互模式,比较典型的应用场景是各类语音助手. 本文整理了语音交互领域常用的4个术语,希望可以帮助大家更好地理解这门学科. 1. 语音合成标记语言(SSML) 语音合成标 ...

  6. 让你的浏览器变成Siri一样的语音助手

    最近业余时间浏览技术文章的时候,看到了一篇关于语音朗读的文章:Use JavaScript to Make Your Browser Speak(用Javascript让你的浏览器说话),文章中提到可 ...

  7. ros语音交互(四)移植科大讯飞语音识别到ros

    将以前下载的的语音包的 samples/iat_record/的iat_record.c speech_recognizer.c speech_recognizer.c 拷贝到工程src中, linu ...

  8. ROS语音交互(三)科大讯飞语音在ROS平台下使用

    以上节tts语音输出为例 下载sdk链接:http://www.xfyun.cn/sdk/dispatcher 1.下载SDK,解压: 2.在ROS工作空间下创建一个Package: catkin_c ...

  9. ROS语音交互——科大讯飞语音合成TTS(二)

    之前我用过科大讯飞的语音包,为了记录一下我重新使用一下 首先注册科大讯飞账号及应用,以后每个下载的在线使用SDK都是以此账户ID登录讯飞语音服务器. 下载科大讯飞在线合成包. $ unzip Linu ...

随机推荐

  1. margin、padding单位百分比

    年前做了一个测试题 https://www.wenjuan.com/s/VjaEva/,里面有一道题目涉及到了margin和padding单位为百分比的情况.写出来记录一下以防止自己忘记. <! ...

  2. thinkphp 使用插件异步上传图片或者文件

    使用tp做一些上传的功能,的确挺方便.但是在一些特殊情况下无法单独的使用tp的上传功能, 或者需要做一些比较酷炫的上传效果,这里就需要用到框架了. 我在这里使用的是uploadify上传插件. 首先需 ...

  3. 理论篇:关注点分离(Separation of concerns, SoC)

    概念 关注点分离(Separation of concerns,SOC)是对只与"特定概念.目标"(关注点)相关联的软件组成部分进行"标识.封装和操纵"的能力, ...

  4. Cesium基础使用介绍

    前言 最近折腾了一下三维地球,本文简单为大家介绍一款开源的三维地球软件--Cesium,以及如何快速上手Cesium.当然三维地球重要的肯定不是数据显示,这只是数据可视化的一小部分,重要的应该是背后的 ...

  5. 【17-06-19】Java进阶自测:面向对象基础知识掌握了吗?(附答案及个人解析)

    描述 题目和答案来自于阿里云大学 - 知乎专栏 题目 现在有如下一段代码 public class Test { public int aMethod() { static int i=0; i++; ...

  6. 腾讯 AI Lab 计算机视觉中心人脸 & OCR团队近期成果介绍(3)

    欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:周景超 在上一期中介绍了我们团队部分已公开的国际领先的研究成果,近期我们有些新的成果和大家进一步分享. 1 人脸进展 人脸是最重要的视觉 ...

  7. Python测试开发之函数

    对于初学者而言,感觉函数还是不是很好理解,尤其是当写一个脚本,或者是写一个算法,认为可能for循环就已经可以解决的问题为什么还要用函数来实现呢? 今天就来说一下函数的优点,其实函数的最大优点就是可重用 ...

  8. 浅谈使用git进行版本控制

    小编在学习可视化的时候,接触到git,所以这里写一下关于GitHub的有关知识,写这个的目的还是巩固自己的学习,一方面可以提高自己,另一方面回头看一下,有什么更深层次的东西还可以再记录. 首先说一下版 ...

  9. P1156 垃圾陷阱

    题目描述 卡门――农夫约翰极其珍视的一条Holsteins奶牛――已经落了到“垃圾井”中.“垃圾井”是农夫们扔垃圾的地方,它的深度为D(2<=D<=100)英尺. 卡门想把垃圾堆起来,等到 ...

  10. c# 初识WPF

    WPF,全名是Windows Presentation Foundation,是微软在.net3.0 WinFX中提出的.WPF是对Direct3D的托管封装,它的图形表现依赖于显卡.当然,作为一种更 ...