相信很多人都体验过手机没有网时的焦虑,没有网什么也做不了。而机器人也会遇到这样的时刻,没有网或者网络环境不好的情况下,无法识别用户在说什么,也无法回复用户。在AIoT(AI+物联网)飞速普及的现在,智能对话已经渗透在许多行业场景中,融入在无数的智能设备里,比如智能家居、智能车载等。这些设备的智能化能力通常都依赖在线服务实现,但智能设备尤其是移动型智能设备可能存在无网情况。

  在未来的AIoT领域中,大多场景都要求终端具备本地自主决断及响应能力,每个设备端都需要具备不依赖云端的独立计算能力,完成智能对话的本地识别,实现端计算,让设备无论在什么网络环境下都能够响应用户对话。针对这种场景的痛点,百度UNIT 3.0推出嵌入式对话理解技术,利用这项技术,可以实现本地化不联网的语义识别能力,结合语音的本地识别能力,结合云端的AI,让本地和云端的有效配合,以满足用户随时随地的对话需求。

  【嵌入式对话理解技术解读】

  嵌入式对话理解技术框架如上图所示,整体通过SDK提供给开发者,开发者可根据自己系统的情况,封装成系统应用,再整体集成入自己的设备中。其中SDK内部将提供离线中控的能力,来控制多个场景的分发与管理。在SDK中支持多个场景的集成,并提供通用的离线中控对它们进行分发、优先级排序等管理能力。

  每一个单独场景的垂类技能主要包含了离线语义解析能力,包括基础分析、启发式语义理解技术、结果选择等技术模块,以及离线语义解析模型。

  其中基础分析分析包含了query的特征、paddle模型结果、通用成分分析(分词、命名实体识别等)等技术。

  启发式语义理解技术,包含了启发式的模板匹配识别、样本泛化匹配识别、结果融合推导等技术。

  结果选择模块包含了非多轮结果的选择能力。

  整体方案中,还提供了日志统计及分析能力,供开发者分析和提升效果使用。

  【如何使用嵌入式对话理解技术】

  目前,嵌入式对话理解技术已提供Android SDK,后续将逐步提供多种系统和平台,如QNX、Linux等。同时提供了开发者可自行修改和本地化训练的工具,包含完善的说明文档,开发者均可以在UNIT平台上下载试用。

  进入UNIT平台“创新技术”区,点击“语义解析 离线使用”即可进入详情,按照操作步骤,可以下载对应的开发工具和安装包。

  【四步获取资源,源码级控制】

  第一步:确定业务是否适用离线解析

  离线(断网)环境下的语义解析,对设备终端的性能是有一定要求。开发者需要确认自己的业务场景是否需要获得离线的语义能力,设备终端能否支持离线语义能力运行。

  第二步:获取现有的离线场景文件,源码级修改

  UNIT 3.0已有多个场景下的技能,可以直接在平台上下载对应的文件。部分场景下的解析文件,需要开发者向UNIT提交邮件申请获取,官方会沟通使用需求并提供支持。下载的技能文件,开发者如有更改技能的需求或者是提升识别的效果要求,均可以自行修改其中的模板等内容,平台上提供了数据优化配置的说明。

  第三步:调用工具完成本地化训练

  步骤二中的场景文件如有更改,开发者需要使用训练工具将该场景自行完成训练,训练后可以获得新的模型文件。训练工具和调用的方法、说明等均在UNIT平台上,支持开发者随时下载查阅和使用。

  第四步:集成模型,使用SDK

  步骤三生成的模型文件,按照SDK的要求放在对应的目录下,开发者可以在UNIT平台上直接下载SDK,按照调用说明直接使用即可。

  【离在线融合对话能力的部署方案】

  不同的业务场景会用到不同的解析和对话能力,在线服务具备更好的对话理解与满足,离线能力保证设备在各种环境下的核心智能交互稳定性;UNIT3.0提供了离在线融合的对话理解框架,开发者可以根据自身的业务情况,灵活选择离线与在线能力。

  开发者可以检测自己的终端设备网络信号情况。当信号比较强时,可以统一走在线解析,在线的云端服务器拥有过更好的计算资源,理解效果会更好。当终端信号比较弱时,建议同时走在线和离线的部分,离线SDK会很快给出响应,在线SDK会根据不稳定的网络情况,可能存在一定的延时;此时开发者可以根据自己业务对性能的要求,来选择使用离线的结果,还是等待在线的结果。当终端无网络时,开发者只能选择离线SDK的方案,快速响应用户。

相关文章阅读:

百度大脑UNIT3.0解读之对话式文档问答——上传文档获取对话能力

百度大脑UNIT3.0详解之语音语义一体化方案

百度大脑UNIT3.0详解之数据生产工具DataKit

百度大脑UNIT3.0详解之知识图谱与对话

百度大脑UNIT3.0详解之嵌入式对话理解技术的更多相关文章

  1. 百度大脑UNIT3.0详解之知识图谱与对话

    如今,越来越多的企业想要在电商客服.法律顾问等领域做一套包含行业知识的智能对话系统,而行业或领域知识的积累.构建.抽取等工作对于企业来说是个不小的难题,百度大脑UNIT3.0推出「我的知识」版块专门为 ...

  2. 百度大脑UNIT3.0详解之数据生产工具DataKit

    在智能对话项目搭建的过程中,高效筛选.处理对话日志并将其转化为新的训练数据,是对话系统效果持续提升的重要环节,也是当前开发者面临的难题之一.为此百度大脑UNIT推出学习反馈闭环机制,提供数据获取.辅助 ...

  3. 百度大脑UNIT3.0详解之语音语义一体化方案

    在电话客服场景里,用户和机器人交流的过程中,经常会出现沉默.打断机器人.噪声等情况,机器人在应对这些异常情况的时候,需要语音和语义理解技术进行处理,才能实现用户和机器人的流畅交谈.而这些能力的获取与应 ...

  4. 百度大脑UNIT3.0智能对话技术全面解析

    智能客服.智能家居.智能助手.智能车机.智能政务……赋予产品智能对话能力是提升产品智能化体验.高效服务的重要手段,已经开始被越来越多的企业关注并布局.然而,智能对话系统搭建涉及NLP.知识图谱.语音等 ...

  5. 百度大脑UNIT3.0解读之对话式文档问答——上传文档获取对话能力

    在日常生活中,用户会经常碰到很多复杂的规章制度.规则条款.比如:乘坐飞机时,能不能带宠物上飞机,3岁小朋友是否需要买票等.在工作中,也会面对公司多样的规定制度和报销政策.比如:商业保险理赔需要什么材料 ...

  6. iOS百度地图简单使用详解

    iOS百度地图简单使用详解 百度地图 iOS SDK是一套基于iOS 5.0及以上版本设备的应用程序接口,不仅提供展示地图的基本接口,还提供POI检索.路径规划.地图标注.离线地图.定位.周边雷达等丰 ...

  7. 发布AI芯片昆仑和百度大脑3.0、L4自动驾驶巴士量产下线,这是百度All in AI一年后的最新答卷...

    机器之心报道,作者:李泽南. 去年的 7 月 5 日,百度在北京国际会议中心开办了首届「AI 开发者大会」.在会上,百度首次喊出了「All in AI」的口号.一年的时间过去了,今天在同样地点举行的第 ...

  8. 减少HTTP请求之合并图片详解(大型网站优化技术)

    原文:减少HTTP请求之合并图片详解(大型网站优化技术) 一.相关知识讲解 看过雅虎的前端优化35条建议,都知道优化前端是有多么重要.页面的加载速度直接影响到用户的体验.80%的终端用户响应时间都花在 ...

  9. Mysql加锁过程详解(8)-理解innodb的锁(record,gap,Next-Key lock)

    Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

随机推荐

  1. fastjson自定义序列化竟然有这么多姿势?

    本文介绍下fastjson自定义序列化的各种操作. 一.什么是fastjson? fastjson是阿里巴巴的开源JSON解析库,它可以解析JSON格式的字符串,支持将Java Bean序列化为JSO ...

  2. WebGPU学习(一): 开篇

    介绍 大家好,本系列从0开始学习WebGPU API,并给出相关的demo. WebGPU介绍 WebGPU相当于DX12/Vulkan,能让程序员更灵活地操作GPU,从而大幅提升性能. 为什么要学习 ...

  3. Chapter 07-Basic statistics(Part3 correlations)

    这一部分使用R基础已安装包中的state.x77数据集.该数据集的数据是关于美国50个州在1977年对人口,收入,文盲率,平均寿命,谋杀率,高中毕业率统计所得. 1.关联的种类(types of co ...

  4. Nginx动静分离(Nginx+Tomcat)

    第一步:nginx构建 第二步:Tomcat构建 1.Tomcat基础点 (1)Tomcat 是基于java开发的web容器,用来发布java代码和jsp网页. (2)开发人员开发java web网站 ...

  5. ASI中POST请求和文件下载

    //POST请求 1 - (void)touchesBegan:(NSSet *)touches withEvent:(UIEvent *)event { // 1.URL NSURL *url = ...

  6. ThinkPHP 中 where条件 or,and 同时使用

    ('a'=1 and 'b'=2) or ('c'=3 and 'd'=4) and 'e'=5 $where_1['a'] = 1; $where_1['b'] = 2; $where_2['c'] ...

  7. 【开发记录】Linux常用命令记录(一)

    记录CentOS下,常用的命令.有时候很难记得清楚,同时方便新来的同学查阅.(将不停的追加和完善) 1)查看CPU情况 cat /proc/cpuinfo |grep "model name ...

  8. 转:IK分词原理

    IKAnalyzer是一个开源的,基于Java语言开发的轻量级的中文分词语言包,它是以Lucene为应用主体,结合词典分词和文法分析算法的中文词组组件.从3.0版本开始,IK发展为面向java的公用分 ...

  9. ASP.NET Core 选项模式源码学习Options IOptions(二)

    前言 上一篇文章介绍IOptions的注册,本章我们继续往下看 IOptions IOptions是一个接口里面只有一个Values属性,该接口通过OptionsManager实现 public in ...

  10. Python--glob模块

    0.glob模块和通配符 glob模块最主要的方法有2个: 1.glob() 2.iglob() 以上2分方法一般和通配符一起使用,常用的通配符有3个: * :匹配零个或多个字符 ? :匹配任何单个的 ...