前记

  人机交互经历了三个阶段键鼠、触屏和语音交互。在国外,谷歌、亚马逊、苹果等巨头的竞争已经到达白热化状态;在国内,百度的DuerOS凭借着入局早,投入大,已经成为国内语音互交的一面旗帜。无论是从技术实力,还是商用步伐,它都走在国内AI公司的前列。想做AI语音的公司,跟着百度走,也算是一条路吧。

蓝牙智能语音现状

  目前绝大多数蓝牙语音设备面临很多问题,包括需要触碰或按键触发,这在在车载上使用很不方便;在使用语音交互设备时,语音输入延时明显,甚至存在App串扰等问题。这也使得现在基于蓝牙协议的语音设备备受诟病。
 造成这种现象的原因是大多蓝牙设备受限于芯片资源和成本,无法引入唤醒词,没有Hands-free体验;利用A2DP和HFP实现播放和语音输入;没有一种标准的协议可以支持蓝牙语音业务的,语音输入过程中会占用手机电话录音通道,造成用户体验非常的差。

DMA协议

 为了更好的语音交互体验,百度开放了DMA蓝牙协议。给自己以及第三方方案厂商和产品公司使用,配合小度app来使用。
 什么是DMA呢?DMA(DuerOS Mobile Accessory)协议在优化语音技术方案选型方案上包括三个方面:蓝牙传输协议选用BLE、RFCOMM双模,音频压缩推荐使用不影响语音交互效果的POUS压缩,唤醒方式,支持触碰、按键、唤醒词多种交互方式。
 当外设收到请求会反馈版本等信息,如果手机只支持BLE,则通过BLE配对;如果支持RFCOMM,则选用RFCOMM配对。

百度的商业模式

 百度开放的原因是想依靠这来抢占语音的流量入口。硬件他们是不愿意碰的,也不是他们擅长的领域,这些电子硬件产品对百度来说,是一个赚钱太难的行业。远远没有卖广告赚钱。
 百度通过小度App提供内容,通过DMA SDK和源代码提供设备相关定制方案及能力支持。来打通整个产业链,让每个设备都能够使用小度app来进行服务就行了。这种模式下的方案主要有两种:
 基础版:通过车载蓝牙方案解释了合作方面,首先提供一块PCBA板,合作伙伴可以基于此进行开发,厂商如果只需要小度相关的语音交互功能的基础能力和5W无线充电,通过这一方案,几天时间就可以实现;
 定制版:如果用户需要更多定制功能,百度提供基于DMA协议的功能底板和蓝牙模组,提供开放接口的功能底板,以做定制功能开发。还可以有第三方方案公司来提供百度的方案。
 当然,百度的这种说法,定制开发,也只能局限于非常大的客户,假如你是中小企业,想让百度去帮忙定制开发,难度估计大了一些。

用户体验

 DMA有效解决了经典蓝牙协议的三个痛点:

1 操纵耳机必须要靠按键:可以通过语音实时唤醒,拨打电话,播放指定音乐等功能。
2 本地语音唤醒识别率低:支持语义唤醒,优化后的模型,在复杂环境下唤醒率也能达到97%以上
3 语音输入延时明显问题。DMA协议使用的是BLE/RFCOMM通道,不但能够和A2DP可以同时使用,还可以有效减少蓝牙系统中的编解码时间,能够极大的压缩音频的延时,延时从500ms~2000ms下降到200ms~300ms;这个对用户的实时语音互交体验是一个质的提升。

百度DMA+小度App的蓝牙语音解决方案入局的更多相关文章

  1. 百度DMA+小度App的蓝牙语音解决方案技术难点解析

    前记   你平时在商场看到的语音助手,看起来非常的简单,其实,这个小小语音助手的背后,是一个非常的复杂的技术支撑.从前端到后端的技术依次是:前端语音降噪技术,高效的音频编解码技术,蓝牙双模技术,DMA ...

  2. 百度DMA+小度App的蓝牙语音解决方案展示

    前记   跟着百度也有一段时间了,经过一年多的努力,我们也做出了一些基于百度的语音助手的产品方案.下面就给大家秀一下我们做的产品.有类似需求的朋友可以多多交流.我们的合作方式十分灵活,可以卖芯片你自己 ...

  3. 百度DMA+小度App的蓝牙语音解决方案案例展示

    前记   跟着百度也有一段时间了,经过一年多的努力,我们也做出了一些产品.下面就给大家秀一下我们做的产品.有类似需求的朋友可以多多交流. 智能语音耳机   这个是就是可以通过按键来调用小度app的运动 ...

  4. 【阿里聚安全技术公开课】移动APP漏洞风险与解决方案

    阿里云·云栖社区携手阿里聚安全打造阿里安全技术公开课,带你一探互联网安全的风采 关于移动APP安全 移动App是大家使用手机每天接触最多的东西,然而在移动APP开发中,由于一些开发工程师对安全的不重视 ...

  5. BD09坐标(百度坐标) WGS84(GPS坐标) GCJ02(国测局坐标) 的相互转换

    BD09坐标(百度坐标) WGS84(GPS坐标) GCJ02(国测局坐标) 的相互转换 http://www.cnphp6.com/archives/24822 by root ⋅ Leave a ...

  6. Hybrid App技术批量制作APP应用与跨平台解决方案

    前言 简单的聊一聊我开发了4年之久的Hybrid App(混合模式移动应用)平台开发,目前一直在持续开发与维护,支持无编程快速开发! 其本意也不是要吹捧前端有多么强大,只是用自己的实际项目阐述下对于前 ...

  7. Ionic2使用百度地图API(JS)出现白屏解决方案

    最近自学ionic2,写了一个内嵌百度地图JS的demo,实际跑起来之后出现了大家常见的白屏问题.. 最初的实现是这样的: 首先主页内嵌了一个百度地图插件 <div id="Bmap& ...

  8. Arduino系列之智能家居蓝牙语音遥控灯(四)

    用到的材料 Arduino uno hc-05   蓝牙模块 安卓手机 安卓APP AMR—voice 通过安卓手机连接Arduino的蓝牙模块Hc-05,通过语音识别软件AMR-voice识别语音, ...

  9. web app开发利器 - iscroll4 解决方案

    存在即是道理,iscroll会诞生,主要是因为无论是在iphone.ipod.android 或是更早前的移动webkit都没有提供一种原生的方式来支持在一个固定高度的容器内滚动内容, 这个不幸的规则 ...

随机推荐

  1. 快递查询API接口集成,有需要的可以直接用

    适用于涉及经常发货.寄快递的人群.企业.电商网站.微信公众号平台等对接使用.支持国内外三百多家快递及物流公司的快递单号一站式查询. 使用说明: 1.KuadidiAPI.php 不需要修改改任何东西 ...

  2. eBPF Tracing 入门教程与实例

    原文链接 Learn eBPF Tracing: Tutorial and Examples译者 弃余 在 LPC'18(Linux Plumber's conference) 会议上,至少有24个关 ...

  3. 20190608笔试题のCSS-属性继承

    以下的CSS属性哪些可以继承?(单选) A.   font-sizeB.   marginC.   widthD.   padding emmm,这题答案是A,看到这题我是能选对的,但又不由让我想到一 ...

  4. Bert系列(三)——源码解读之Pre-train

    https://www.jianshu.com/p/22e462f01d8c pre-train是迁移学习的基础,虽然Google已经发布了各种预训练好的模型,而且因为资源消耗巨大,自己再预训练也不现 ...

  5. 冒泡排序&直接插入排序&快速排序

    一.冒泡排序 0       1      2      3      4      5 假设有一个6个数的数组,0,1,2,3,4,5是索引,冒泡排序就是相邻两个对比,比如5和4比,如果满足条件就互 ...

  6. HTML静态网页--JavaScript-Window.document对象

    1.Window.document对象 一.找到元素: docunment.getElementById("id"):根据id找,最多找一个:    var a =docunmen ...

  7. poj 2451 Uyuw's Concert (半平面交)

    2451 -- Uyuw's Concert 继续半平面交,这还是简单的半平面交求面积,不过输入用cin超时了一次. 代码如下: #include <cstdio> #include &l ...

  8. H3C OSPF协议分区域管理

  9. 关于Android studio Haxm加速器安装

    首先,在SDK manager中要安装如下选项 安装后,在启动虚拟机时如果提示你没有Install Haxm,在目录sdk\extras\intel\Hardware_Accelerated_Exec ...

  10. C# 使用转换语义版本号

    本文告诉大家如何转换语义版本号,那么什么是语义版本号,语义版本号(semantic version)就是版本号带 alpha 等的版本号 在以前的版本号都是这样 1.2.1 的格式,这个格式可以使用微 ...