转:Siri之父:语音交互或将主导未来十年发展
http://zhinengjiaohu.juhangye.com/201709/weixin_5664458.html
Siri之父Adam Cheyer认为,语音交互很可能是未来十年内计算技术的一个典型特征。与会分享的还有谷歌、亚马逊和微软虚拟助手产品的负责人。
Siri之父Adam Cheyer认为,语音交互很可能是未来十年内计算技术的一个典型特征。上周,在一次座谈会上,他分享了自己对人工智能助手未来发展的看法,座谈会上的嘉宾还有谷歌助手产品总监Gummi Hafsteinsson(也曾参与Siri的研究工作),亚马逊Alexa高级项目经理Ashwin Ram以及微软小娜产品团队主管Jordi Ribas。
为何说Adam
Cheyer是Siri之父呢?这就不得不提到Siri的发展历程。Siri的技术最初源于一项科学研究——美国历史上最大型的人工智能项目CALO。该项目致力于打造一个可以学习的虚拟助手,项目结束后,研究员Adam
Cheyer与两个朋友朋友Dag Kittlaus和Chris
Brigham成立了一家公司,来开发Siri。直到2010年,Siri被苹果收购。此后,苹果于2011年发布Siri语音助理,并集成到iPhone
4S中,作为iOS移动操作系统的一部分。2012年Adam
Cheyer离开了苹果,创建了Viv实验室,致力于创建另一个AI虚拟助手,该实验室在2016年被三星以2.15亿美元的价格所收购。
Adam
Cheyer说Viv实验室认为每隔10年左右的时间,人们的计算方式就会发生改变。在20世纪80年代,个人电脑站主导地位;20世纪90年代,网络开始占据主导地位;从2007年开始,移动设备蓬勃兴起;到现在也已经10年的时间了,因此Adam
Cheyer相信所有的关键技术都将迎来“巨大的飞跃”,而且这些技术很快就会在私人助理方面扮演重要的角色。
他表示,所有的这些技术公司都投入了数十亿美元的资金,因此其中的利害关系自然可想而知,丝毫不亚于前几个十年发展的范例。他将范例定义为“每一个与之关联的商业都将会发生改变”,正如发生在iPhone、iPad和其他平板电脑及手机上的一样。而每一个关联用户也将在这个范例中投入大量的计算成本。当这一目标实现时——在未来两到三年是可行的——所有公司都在为此进行各种尝试。虽然我们还处在语音交互的早期,正如当初网络出现时并非交互式的一样,但我们可以看到语音交互这种技术已经浮出水面。
这些东西会更智能吗?Adam Cheyer解释道:“当然,我认为我们目前所拥有的技术足以让我们进入下一个十年。我们每个人都有一个私人助理,借助扬声器、汽车和电话在网上做很多事情。”
集成第三方服务
关于整合或第三方生态系统,行业主要玩家都在利用各自的人工智能助手进行尝试。但正如前几次改变一样,只有少数赢家会主导这种改变,微软和英特尔带来了个人电脑,谷歌和亚马逊普及了网络,正如Cheyer所说,他希望未来只有少量虚拟助手规则,但能实现无缝授权访问第三方服务。
“未来是否会只剩一种虚拟助手?你是否体验过具有高度定制的个性、名字和功能的虚拟助手?这两点在未来是十分有趣的,看虚拟助手市场如何优胜略汰。”Cheyer说道,“现在市面上虚拟助手实在太多了,我其实并不想记住汽车虚拟助手可以做什么,电视系统可以做什么,Alexa和微软小娜可以做什么,这样太麻烦了。我希望每个设备都只有一个通用的虚拟助手来访问所有的服务,其核心和第三方服务并没什么差别。”
学会一起工作
微软小娜产品团队的主管Ribas透露,自从微软与亚马逊合作后,Alexa可以和小娜彼此之间可以互相对话,微软似乎已经开始预测到AI助手未来发展的方向。
“我认为我们与亚马逊在Alexa小娜的合作,在一定程度上都是对未来发展方向的一种押注,正如之前对网络发展的预测一样。现在亚马逊的Alexa可以说是购物的最佳助手,我们希望小娜是微软Office
365的最佳助手。”Ribas表示,“我认为每一个有代理商的公司都会使用第三方代理工具,他们也会对此进行专门的研究。时间是最好的证明,显然未来还有很多事情要发生,也有很长的路要走。”
谷歌助理负责人Hafsteinsson补充道,包括谷歌在内的所有人,都在试图找出第三方应用程序的发展方向。
“如果你看看所有的玩家,我认为我们都希望能让第三方开发者参与进来,但我们还没有找到一个完美的解决方案。所以我们的虚拟助手应用程序——小娜和Alexa有相近的功能。小娜和Alexa在一起工作,但我们都在试图弄清楚当产品涉及第三方服务时,什么样的交互会起作用。但这到底是怎么回事呢?”Hafsteinsson问道。
“我认为我们还在尝试扩展。因为,从我的角度来看,虚拟助手必须保留用户体验,而且便于用户使用,这一切都是自然产生的,而不是刻意强求的。但要想在自然语言界面和所有这些服务之间架起桥梁仍是一个巨大的挑战。”
转:Siri之父:语音交互或将主导未来十年发展的更多相关文章
- 离线语音Snowboy热词唤醒+ 树莓派语音交互实现开关灯
离线语音Snowboy热词唤醒 语音识别现在有非常广泛的应用场景,如手机的语音助手,智能音响(小爱,叮咚,天猫精灵...)等. 语音识别一般包含三个阶段:热词唤醒,语音录入,识别和逻辑控制阶段. 热词 ...
- ROS机器人语音交互(一)
语音交互早期已经广泛应用在手机端,电脑端,随着技术的成熟,接口逐渐开放,ROS上老外搞的开源语音识别只支持英文,识别率还低. 国内语音识别技术已经相当成熟稳定.感谢ros小课堂的讲解,解决了自己的疑惑 ...
- SLAM+语音机器人DIY系列:(七)语音交互与自然语言处理——1.语音交互相关技术
摘要 这一章将进入机器人语音交互的学习,让机器人能跟人进行语音对话交流.这是一件很酷的事情,本章将涉及到语音识别.语音合成.自然语言处理方面的知识.本章内容: 1.语音交互相关技术 2.机器人语音交互 ...
- 基于flask和百度AI接口实现前后端的语音交互
话不多说,直接怼代码,有不懂的,可以留言 简单的实现,前后端的语音交互. import os from uuid import uuid4 from aip import AipSpeech from ...
- 曼孚科技:AI语音交互领域常用的4个术语
语音交互是基于语音输入的新一代交互模式,比较典型的应用场景是各类语音助手. 本文整理了语音交互领域常用的4个术语,希望可以帮助大家更好地理解这门学科. 1. 语音合成标记语言(SSML) 语音合成标 ...
- 让你的浏览器变成Siri一样的语音助手
最近业余时间浏览技术文章的时候,看到了一篇关于语音朗读的文章:Use JavaScript to Make Your Browser Speak(用Javascript让你的浏览器说话),文章中提到可 ...
- ros语音交互(四)移植科大讯飞语音识别到ros
将以前下载的的语音包的 samples/iat_record/的iat_record.c speech_recognizer.c speech_recognizer.c 拷贝到工程src中, linu ...
- ROS语音交互(三)科大讯飞语音在ROS平台下使用
以上节tts语音输出为例 下载sdk链接:http://www.xfyun.cn/sdk/dispatcher 1.下载SDK,解压: 2.在ROS工作空间下创建一个Package: catkin_c ...
- ROS语音交互——科大讯飞语音合成TTS(二)
之前我用过科大讯飞的语音包,为了记录一下我重新使用一下 首先注册科大讯飞账号及应用,以后每个下载的在线使用SDK都是以此账户ID登录讯飞语音服务器. 下载科大讯飞在线合成包. $ unzip Linu ...
随机推荐
- Mysql语句查询优化
其实对Mysql查询语句进行优化是一件非常有必要的事情. 如何查看当前sql语句的执行效率呢? 1.建一张学生表 CREATE TABLE `student` ( `stu_id` ) NOT NUL ...
- 常用接口简析3---IList和List的解析
常用接口的解析(链接) 1.IEnumerable深入解析 2.IEnumerable.IEnumerator接口解析 3.IComparable.IComparable接口解析 学习第一步,先上菜: ...
- npm模块管理器入门
什么是 NPM npm 是 Node 官方提供的包管理工具,他已经成了 Node 包的标准发布平台,用于 Node 包的发布.传播.依赖控制.npm 提供了命令行工具,使你可以方便地下载.安装.升级. ...
- Java内存模型与Java线程实现原理
硬件的效率与一致性 基于高速缓存的存储交互很好的解决了处理器和内存的速度矛盾,但是也为计算机系统带来了更高的复杂度,因为引入了一个新问题:缓存一致性. 在多处理器系统中,每个处理器都有自己的高速缓存, ...
- php面向对象(OOP)编程完全教程(转载笔记,有兴趣可以看看))
http://www.cnblogs.com/xiaochaohuashengmi/archive/2010/09/10/1823042.html
- SpringBoot零基础入门指南--搭建Springboot然后能够在浏览器返回数据
File->new Project 修改默认包名,根据自己的喜好修改 选择初始化需要导入的包,尽量不要一开始就导入很多,特别是数据库,不然启动可能会有问题,创建好的目录如下: 配置文件写在app ...
- Android破解学习之路(二)——Android游戏 滚动的天空破解
经过上一期的破解教程,相信大家跟我一样都是对破解是初入门,我们破解的目的是什么? 赚钱吗?百度上一大堆破解版的应用,破解的人有赚到钱吗?实实在在的说,其实也是方便自己而已. 玩个游戏,感觉过不去了,来 ...
- 使用hiredis实现pipeline方式访问
1.介绍 hiredis: 一个c/c++的访问redis的api库 地址:https://github.com/redis/hiredis pipeline方式: redis中的pipeline方式 ...
- Linux下一次删除百万文件
Linux下一次删除百万文件 线上环境遇到的一个问题,文件数量过多,执行rm命令报错 # rm -f ./* -bash: /bin/rm: Argument list too long 根据报错检查 ...
- SSIS中循环遍历组件[Foreach Loop Container]
背景 每月给业务部门提取数据,每个分公司都要提取一般,先跑SQL,再粘贴到Excel中,然后发邮件给相关的人员.费时费力,还容易粘贴错位.因此,需要通过一个程序完成这些步骤.我首先想到的是通过SSIS ...