Dynamic seq2seq in tensorflow

v1.0中 tensorflow渐渐废弃了老的非dynamic的seq2seq接口，已经放到 tf.contrib.legacy_seq2seq目录下面。

tf.contrib.seq2seq下面的实现都是dynamic seq2seq接口。

按照google的rd说法下个月将会给出更加完善的接口和实现。

当前版本也可以使用这里尝试分析一下现有dynamic seq2seq的代码。

首先核心函数是seq2seq.py下面的 dynamic_rnn_decoder

这里首先看下dynamic的概念，即不需要确定的输入长度，以及batch 大小，
都可以动态。

但是注意首先每个batch对应所有样本的输入长度还是需要一样的
作为dense数据
否则
不可处理

这也就是说如果你需要特别在意速度的话，即使使用dyanmic 也可能还需要使用bucket来聚集相似长度的

输入样本作为一个batch 加速训练。

不过一般意义上不用的话，代码比较简单，加上dyanmic的seq2seq 性能也可以接受，同时好处是每个batch

的样本可以完全随机。

dynamic_rnn_decoder核心是内部调用raw_rnn来实现迭代过程，这里的dynamic最主要体现在输入的

decoder_fn函数上面。

这个函数允许计算提前终止(early stop) 也就是说
假如你做inference，不用dynamic seq2seq

你一般的做法是指定一个
最大decode长度
比如20, 那么对应所有样本其实都需要decode走完20个

Step 哪怕所有的样本对应输出序列长度都不大于10。

而有了dynamic decode 当一个batch 所有的样本decode到达
类似<END>结束符之后，整个decode过程就

结束了。

但是注意这里仍然是以batch为基础的，也就是说有一个样本比如decode 2次就到达结束符，但是由于

组内其它样本没有结束，仍然需要所有样本继续向后解析，也就是说batch size越大，结束的可能越晚。

dynamic_rnn_decoder有train和inference两种模式，不过如果不使用attention，个人感觉train的时候直接

用dynamic_rnn接口就可以了。

最后按照刚刚master的代码，seq2seq提供了decoder.py以及sampling_decoder.py等相关的示例，

这个接口更加简洁清晰，也就是说不再用context_state来记录用户其余的状态，而是用户自定义

output的结构
将其它信息也直接写入output。

mmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmimmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmm

Dynamic seq2seq in tensorflow的更多相关文章

Dynamic attention in tensorflow
新代码在contrib\seq2seq\python\ops\attention_decoder_fn.py 和之前代码相比不再采用conv的方式来计算乘,直接使用乘法和linear 给出了两种at ...
Effective Tensorflow[转]
Effective TensorFlow Table of Contents TensorFlow Basics Understanding static and dynamic shapes Sco ...
Tensorflow.nn 核心模块详解
看过前面的例子,会发现实现深度神经网络需要使用 tensorflow.nn 这个核心模块.我们通过源码来一探究竟. # Copyright 2015 Google Inc. All Rights Re ...
tensorflow 控制流操作，条件判断和循环操作
Control flow operations: conditionals and loops When building complex models such as recurrent neura ...
【转载 | 翻译】Visualizing A Neural Machine Translation Model（神经机器翻译模型NMT的可视化）
转载并翻译Jay Alammar的一篇博文:Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models Wi ...
深度学习与CV教程(8) | 常见深度学习框架介绍
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/37 本文地址:http://www.showmeai.tech/article-det ...
Hinton's paper Dynamic Routing Between Capsules 的 Tensorflow ， Keras ，Pytorch实现
Tensorflow 实现 A Tensorflow implementation of CapsNet(Capsules Net) in Hinton's paper Dynamic Routing ...
ChatGirl 一个基于 TensorFlow Seq2Seq 模型的聊天机器人[中文文档]
ChatGirl 一个基于 TensorFlow Seq2Seq 模型的聊天机器人[中文文档] 简介简单地说就是该有的都有了,但是总体跑起来效果还不好. 还在开发中,它工作的效果还不好.但是你可以直 ...
ChatGirl is an AI ChatBot based on TensorFlow Seq2Seq Model
Introduction [Under developing,it is not working well yet.But you can just train,and run it.] ChatGi ...

随机推荐

TypeScript语法学习--基本类型
查看官方文档手册:链接:https://www.tslang.cn/docs/home.html (一)Boolean 最基本的数据类型就是简单的true/false值 The most basic ...
3ds max学习笔记-- 动画
栗子:若要使茶壶从a点运动到b点,是需要动画实现的:动画与传统意义的移动不同,与时间是存在关系的: 时间线,时间滑条: [时间配置]按钮: 弹出面板: 动画时间轴默认时间是从0帧开始100结束:总长度 ...
Django中提供的6种缓存方式
由于Django是动态网站,所有每次请求均会去数据进行相应的操作,当程序访问量大时,耗时必然会更加明显,最简单解决方式是使用: 缓存,缓存将一个某个views的返回值保存至内存或者memcache中, ...
JAVA自学笔记12
JAVA自学笔记12 1.Scanner 1)JDK5后用于获取用户的键盘输入 2)构造方法:public Scanner(InputStream source) 3)System.in 标准的输入流 ...
poj3069 Saruman's Army（贪心）
https://vjudge.net/problem/POJ-3069 弄清楚一点,第一个stone的位置,考虑左右两边都要覆盖R,所以一般情况下不会在左边第一个(除非前两个相距>R). 一开始 ...
pygame-KidsCanCode系列jumpy-part11-角色动画(下)
接上节继续,上节并没有处理向左走.向右走的动画效果,这节补上,看似很简单,但是有一些细节还是要注意: def jump(self): hits = pg.sprite.spritecollide(se ...
Python常用的软件包
下面是Python开发常用的软件包. 名称用途安装命令 opengl sudo pip3 install PyOpenGL pyqtgraph GUI图形库 sudo pip3 instal ...
Javascript数组(一)排序
一.简介首先,我们来看一下JS中sort()和reverse()这两个函数的函数吧reverse();这个函数是用来进行倒序,这个没有什么可说的,所谓倒序就是大的在前面,小的在后面. 比如: var ...
04、常用RDD操作整理
常用Transformation 注:某些函数只有PairRDD只有,而普通的RDD则没有,比如gropuByKey.reduceByKey.sortByKey.join.cogroup等函数要根据K ...
通过Tag标签回退版本修复bug
tag是对历史一个提交id的引用,如果理解这句话就明白了使用git checkout tag即可切换到指定tag,例如:git checkout v0.1.0 切换到tag历史记录会处在分离头指针状态 ...

Dynamic seq2seq in tensorflow

Dynamic seq2seq in tensorflow的更多相关文章

随机推荐

热门专题