A Network-based End-to-End Trainable Task-oriented Dialogue System
abstract
让机器去和人类自然的交谈是具有挑战性的。最近的任务型对话系统需要创造几个部分并且通常这需要大量的人工干预,或者需要标注数据去解决各部分训练的问题。在这里我们提出了一种端到端的任务型对话系统,它采取了一种基于管道框架的新颖的收集对话数据的方法。这个方法允许我们轻松实现对话系统而不用过多的人工干预。结果展示模型能够在和人自然交流的同时帮助他们完成餐馆搜索领域的任务。
introduction
构建一个任务型对话系统例如酒店预订或者某种技术支持服务是困难的,因为它属于特定领域应用且对于训练数据的获取也有限制。为了去解决这个问题,近来的针对对话系统设计的机器学习方法将问题转换为一个部分可观马尔科夫决策过程(POMDP),它的目的是通过和真实的使用者进行交互,使用强化学习去训练对话在线决策。然而,语言理解和语言生成模型仍然依赖监督学习并且因此需要语料在其上进行训练。进一步,为了使强化学习(RL)可控,状态和行为空间必须被小心的设计,而这些都会限制模型的表达力和学习能力。而且reward功能也需要被训练,这样的模型很难被设计且很难去测量运行时间。
另一方面来讲,sequence2sequence也促进了可训练、非任务型端到端对话系统构建的研究,这类方案把对话当作从源到目标句子的转换问题,encoder and decoder。他们能够创造高效的聊天机器人但是缺乏支持特殊领域对话的能力,例如和数据库交互和收集有用的信息到他们的对话中。
模型可以端到端的进行训练,但是仍然模块化连接;它没有直接为用户目标建模,但是它仍会通过每一轮的相关的恰当的回复去学习完成被要求的任务;他有用来去达到一个高任务准确率的数据属性的精准表达,但是有一个用户意图的分布式表达去允许模糊的输入;使用delexicalisation和一个权重减少策略去减少训练模型所需的数据,但是仍然会维持一个高自由度使得大量数据成为可获得的。
model
seqence mapping(seqence2seqence) + dialogue history(belief trackers)
在每一轮对话中,
- 系统接受分词后的用户的话然后把他转换成两种表示,一是由一个意图识别网络生成的分布式表示intent representation,二是一种由belief trackers生成的belief state(槽值对)的概率分布。
- 之后数据库节点会在belief state中选择最可能的值去形成一个query给DB
- 数据库搜索结果,意图表示intent representation和belief state被一个policy网络transformer和combine去形成一个简单的向量表示系统的下一步行动action。
- system action 之后被用做condition一个回复生成网络,这个网络是生成系统回复骨架
然后,通过将数据库条目的实际值替换到骨架句结构中,形成最终的系统响应。
intent network
encoder:lstm最后的隐藏层输出 + CNN
belief trackers
dialogue state tracking提供任务型对话系统(spoken dialogue system SDS)的核心。最新的dst使用例如RNN的判别系统去直接将Automatic Speech Recognition (ASR)映射到belief state。尽管我们聚焦在文本对话系统,但是我们仍然在我们的系统核心维持状态追踪因为:
- 它能把一句自然表达转变成固定槽值对表示,进而给DB传query,这可以等同于一个语义分析器
- 通过状态追踪,避免了从原始输入中学习不必要的复杂的长期依赖
通过使用权重
学姐刚才和我说这是个seq2seq....我觉得我可能误会这个model了....
https://www.eefocus.com/industrial-electronics/367104/p7
https://blog.csdn.net/u014300008/article/details/53212915
A Network-based End-to-End Trainable Task-oriented Dialogue System的更多相关文章
- 论文笔记:ReNet: A Recurrent Neural Network Based Alternative to Convolutional Networks
ReNet: A Recurrent Neural Network Based Alternative to Convolutional Networks2018-03-05 11:13:05 ...
- DeepCoder: A Deep Neural Network Based Video Compression
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract: 在深度学习的最新进展的启发下,我们提出了一种基于卷积神经网络(CNN)的视频压缩框架DeepCoder.我们分别对预测 ...
- 论文翻译:2019_Deep Neural Network Based Regression Approach for A coustic Echo Cancellation
论文地址:https://dl.acm.org/doi/abs/10.1145/3330393.3330399 基于深度神经网络的回声消除回归方法 摘要 声学回声消除器(AEC)的目的是消除近端传声器 ...
- 论文翻译:2020_Generative Adversarial Network based Acoustic Echo Cancellation
论文地址:http://www.interspeech2020.org/uploadfile/pdf/Thu-1-10-5.pdf 基于GAN的回声消除 摘要 生成对抗网络(GANs)已成为语音增强( ...
- 论文阅读笔记六十四: Architectures for deep neural network based acoustic models defined over windowed speech waveforms(INTERSPEECH 2015)
论文原址:https://pdfs.semanticscholar.org/eeb7/c037e6685923c76cafc0a14c5e4b00bcf475.pdf 摘要 本文研究了利用深度神经网络 ...
- Python script to package the information of tracking benchmarks like LaSOT and GOT-10k into json files for Siamese network based trackers
############################################################################################ #### Fo ...
- pytorch --Rnn语言模型(LSTM,BiLSTM) -- 《Recurrent neural network based language model》
论文通过实现RNN来完成了文本分类. 论文地址:88888888 模型结构图: 原理自行参考论文,code and comment: # -*- coding: utf-8 -*- # @time : ...
- Codeforces Round #625 (Div. 2, based on Technocup 2020 Final Round) D. Navigation System(有向图,BFS,最短路)
题意: n 点 m 边有向图,给出行走路径,求行走途中到路径终点最短路变化次数的最小值和最大值 . 思路 : 逆向广搜,正向模拟. #include <bits/stdc++.h> usi ...
- Ping of Death
[Ping of Death] The ping of death attack, or PoD, can cripple a network based on a flaw in the TCP/I ...
随机推荐
- 给学习立个flag
今天是2018年7月7号,此时的砖相比昨天格外烫手,望着手套因被磨破而露出来的半截手指头,一股股热浪溜溜的从指间划过,背后还有小山一样高的砖头,感觉对面today店里的冰镇西瓜又成了不可奢望的梦... ...
- MB SD Connect Compact 5 Error 95.53392.0 Solved
MB SD Connect Compact 5 is new released from MB Star company ,and its original version here the copy ...
- 使用shiro框架,解决跳转页面出现404的问题
shiro框架是一个安全框架,在进行登录的时候,如果没有配置路径,它会跳到shiro的默认配置的路径“/”下面,所以总是会出现404的错误,因为它的路径是保存在session中 所以需要我们把sess ...
- centos linux查看硬盘型号
[root@]# smartctl --all /dev/sdasmartctl 6.5 2016-05-07 r4318 [x86_64-linux-3.10.0-957.1.3.el7.x86_6 ...
- 【Bilinear interpolation】双线性插值详解(转)
最近在做视频拼接的项目,里面用到了图像的单应性矩阵变换,在最后的图像重映射,由于目标图像的坐标是非整数的,所以需要用到插值的方法,用的就是双线性插值,下面的博文主要是查看了前辈的博客对双 ...
- Nginx教程---03.Nginx日志切割
Nginx的定时任务与自动切割 明确: 如果这个网站的访问量比较大,那么一天下来 nginx日志可能会特别的大,所以当出现这种情况呢,如果 把每天的日志都存在同一个日志文件里,会使你的日志文件大到让你 ...
- sublime text 3 显示空格和Tab
tab对于需要 共享 的代码而言是灾难. pyhton对这点的明确要求是不要混合使用4个空格和tab键. 只使用二者之一,都是没有问题的.如果一个python代码已经完成的部分,都是使用的4个空格.那 ...
- 用docker-compose部署postgres+ postgis
20190411更新.之前写的太啰嗦,也不删了,重新来.小坑还是有的 psql 命令行客户端 因为postgres用docker镜像安装,所以host不需要安装pg,只需要安装客户端 sudo apt ...
- 【转】 C++析构函数的作用和用法
转自:https://www.cnblogs.com/puyangsky/p/5319470.html 一.定义1. 作用:对象消亡时,自动被调用,用来释放对象占用的空间2.特点: (1) 名字与 ...
- RNA velocity | RNA速率
单细胞转录组确实是利器,但我们大多只利用了表达的信息,而从reads到表达之间的信息完全被我们忽略了. 最近nature发了一篇单细胞方法类文章,讲得就是如何利用RNA velocity来做细胞发育路 ...