Tensorflow中循环神经网络及其Wrappers

tf.nn.rnn_cell.LSTMCell

又名：tf.nn.rnn_cell.BasicLSTMCell、tf.contrib.rnn.LSTMCell
参见: tf.nn.rnn_cell.LSTMCell
输出：
- output：LSTM单元输出，与LSTM cell state的区别在于该输出又经过激活以及和一个sigmoid函数输出相乘。shape: [batch_size,num_units]
- new_state：当前时间步上的LSTM cell state和LSTM output。使用数据结构LSTMStateTuple描述，LSTMStateTuple：(c,h)，其中，h与上述的output完全相同。shape: ([batch_size,num_units],[batch_size,num_units])

示例：

batch_size=10

embedding_size=300

inputs=tf.Variable(tf.random_normal([batch_size,embedding_size]))

previous_state=(tf.Variable(tf.random_normal([batch_size,128])),tf.Variable(tf.random_normal([batch_size,128])))

lstmcell=tf.nn.rnn_cell.LSTMCell(128)

outputs,states=lstmcell(inputs,previous_state)

输出：

outputs:

<tf.Tensor 'lstm_cell/mul_2:0' shape=(10, 128) dtype=float32>

states:

LSTMStateTuple(c=<tf.Tensor 'lstm_cell/add_1:0' shape=(10, 128) dtype=float32>, h=<tf.Tensor 'lstm_cell/mul_2:0' shape=(10, 128) dtype=float32>)

tf.nn.rnn_cell.MultiRNNCell

参见：tf.nn.rnn_cell.MultiRNNCell
输出：
- outputs: 最顶层cell的最后一个时间步的输出。shape：[batch_size,cell.output_size]
- states：每一层的state，M层LSTM则输出M个LSTMStateTuple组成的Tuple。

示例：

batch_size=10

inputs=tf.Variable(tf.random_normal([batch_size,128]))

previous_state0=(tf.random_normal([batch_size,100]),tf.random_normal([batch_size,100]))

previous_state1=(tf.random_normal([batch_size,200]),tf.random_normal([batch_size,200]))

previous_state2=(tf.random_normal([batch_size,300]),tf.random_normal([batch_size,300]))

num_units=[100,200,300]

cells=[tf.nn.rnn_cell.LSTMCell(num_unit) for num_unit in num_units]

mul_cells=tf.nn.rnn_cell.MultiRNNCell(cells)

outputs,states=mul_cells(inputs,(previous_state0,previous_state1,previous_state2))

输出：

outputs:

<tf.Tensor 'multi_rnn_cell_1/cell_2/lstm_cell/mul_2:0' shape=(10, 300) dtype=float32>

states:

(LSTMStateTuple(c=<tf.Tensor 'multi_rnn_cell_1/cell_0/lstm_cell/add_1:0' shape=(10, 100) dtype=float32>, h=<tf.Tensor 'multi_rnn_cell_1/cell_0/lstm_cell/mul_2:0' shape=(10, 100) dtype=float32>),

 LSTMStateTuple(c=<tf.Tensor 'multi_rnn_cell_1/cell_1/lstm_cell/add_1:0' shape=(10, 200) dtype=float32>, h=<tf.Tensor 'multi_rnn_cell_1/cell_1/lstm_cell/mul_2:0' shape=(10, 200) dtype=float32>),

 LSTMStateTuple(c=<tf.Tensor 'multi_rnn_cell_1/cell_2/lstm_cell/add_1:0' shape=(10, 300) dtype=float32>, h=<tf.Tensor 'multi_rnn_cell_1/cell_2/lstm_cell/mul_2:0' shape=(10, 300) dtype=float32>))

tf.nn.dynamic_rnn

参见：tf.nn.dynamic_rnn
输出：
- outputs: 每个时间步上的LSTM输出；若有多层LSTM，则为每一个时间步上最顶层的LSTM的输出。shape: [batch_size,max_time,cell.output_size]
- state：最后一个时间步的状态，该状态使用LSTMStateTuple结构输出；若有M层LSTM，则输出M个LSTMStateTuple。shape：单层LSTM输出：[batch_size,cell.output_size]；M层LSTM输出：M个LSTMStateTuple组成的Tuple，这也即是说：outputs[:,-1,:]==state[-1,:,:]。

示例：

batch_size=10

max_time=20

data=tf.Variable(tf.random_normal([batch_size,max_time,128]))

# create a BasicRNNCell

rnn_cell = tf.nn.rnn_cell.BasicRNNCell(num_units=128)

# defining initial state

initial_state = rnn_cell.zero_state(batch_size,dtype=tf.float32)

# 'outputs' is a tensor of shape [batch_size, max_time, cell_state_size]

# 'state' is a tensor of shape [batch_size, cell_state_size]

outputs, state = tf.nn.dynamic_rnn(cell=rnn_cell, inputs=data,

                                   initial_state=initial_state,

                                   dtype=tf.float32)

输出：

outpus:

<tf.Tensor 'rnn_2/transpose_1:0' shape=(10, 20, 128) dtype=float32>

state:

<tf.Tensor 'rnn_2/while/Exit_3:0' shape=(10, 128) dtype=float32>

batch_size=10

max_time=20

data=tf.Variable(tf.random_normal([batch_size,max_time,128]))

# create 2 LSTMCells

rnn_layers = [tf.nn.rnn_cell.LSTMCell(size) for size in [128, 256]]

# create a RNN cell composed sequentially of a number of RNNCells

multi_rnn_cell = tf.nn.rnn_cell.MultiRNNCell(rnn_layers)

# 'outputs' is a tensor of shape [batch_size, max_time, 256]

# 'state' is a N-tuple where N is the number of LSTMCells containing a

# tf.contrib.rnn.LSTMStateTuple for each cell

outputs, state = tf.nn.dynamic_rnn(cell=multi_rnn_cell,

                                   inputs=data,

                                   dtype=tf.float32)

outputs:

<tf.Tensor 'rnn_1/transpose_1:0' shape=(10, 20, 256) dtype=float32>

state:

(LSTMStateTuple(c=<tf.Tensor 'rnn_1/while/Exit_3:0' shape=(10, 128) dtype=float32>, h=<tf.Tensor 'rnn_1/while/Exit_4:0' shape=(10, 128) dtype=float32>),

 LSTMStateTuple(c=<tf.Tensor 'rnn_1/while/Exit_5:0' shape=(10, 256) dtype=float32>, h=<tf.Tensor 'rnn_1/while/Exit_6:0' shape=(10, 256) dtype=float32>))

tf.nn.bidirectional_dynamic_rnn
- 参见：tf.nn.bidirectional_dynamic_rnn
- 输出：
  - outputs：(output_fw,output_bw)：前向cell+后向cell
    
    其中，output_fw、output_bw均为：[batch_size,max_time,cell.output_size]
  - state：(output_state_fw,output_state_bw)：包含前向和后向隐状态组成的元组
    
    其中，output_state_fw、output_state_bw均为LSTMStateTuple。LSTMStateTuple:(c,h)，分别为cell_state，hidden_output
tf.contrib.seq2seq.dynamic_decode
- 输出：
  - final_outputs，包含rnn_output和sample_id，分别可用final_output.rnn_output和final_outputs.sample_id获取到。
  - final_state，可以从最后一个解码器状态获取alignments，alignments = tf.transpose(final_decoder_state.alignment_history.stack(), [1, 2, 0])
  - final_sequence_lengths

Tensorflow中循环神经网络及其Wrappers的更多相关文章

tensorflow实现循环神经网络
包括卷积神经网络(CNN)在内的各种前馈神经网络模型, 其一次前馈过程的输出只与当前输入有关与历史输入无关. 递归神经网络(Recurrent Neural Network, RNN)充分挖掘了序列数 ...
基于TensorFlow的循环神经网络(RNN)
RNN适用场景循环神经网络(Recurrent Neural Network)适合处理和预测时序数据 RNN的特点 RNN的隐藏层之间的节点是有连接的,他的输入是输入层的输出向量.extend(上一 ...
tensorflow RNN循环神经网络 (分类例子)-【老鱼学tensorflow】
之前我们学习过用CNN(卷积神经网络)来识别手写字,在CNN中是把图片看成了二维矩阵,然后在二维矩阵中堆叠高度值来进行识别. 而在RNN中增添了时间的维度,因为我们会发现有些图片或者语言或语音等会在时 ...
tensorflow中的神经网络笔记
1.NN----神经网络 2.CNN卷积神经网络 CNN网络一共有5个层级结构: 输入层卷积层激活层池化层全连接FC层一.输入层与传统神经网络/机器学习一样,模型需要输入的进行预处理操作, ...
TensorFlow学习笔记（六）循环神经网络
一.循环神经网络简介循环神经网络的主要用途是处理和预测序列数据.循环神经网络刻画了一个序列当前的输出与之前信息的关系.从网络结构上,循环神经网络会记忆之前的信息,并利用之前的信息影响后面节点的输出. ...
TensorFlow系列专题（七）：一文综述RNN循环神经网络
欢迎大家关注我们的网站和系列教程:http://panchuang.net/ ,学习更多的机器学习.深度学习的知识! 目录: 前言 RNN知识结构简单循环神经网络 RNN的基本结构 RNN的运算过程 ...
4.5 RNN循环神经网络（recurrent neural network）
自己开发了一个股票智能分析软件,功能很强大,需要的点击下面的链接获取: https://www.cnblogs.com/bclshuai/p/11380657.html 1.1 RNN循环神经网络 ...
TensorFlow——循环神经网络基本结构
1.导入依赖包,初始化一些常量 import collections import numpy as np import tensorflow as tf TRAIN_DATA = "./d ...
用tensorflow实现自然语言处理——基于循环神经网络的神经语言模型
自然语言处理和图像处理不同,作为人类抽象出来的高级表达形式,它和图像.声音不同,图像和声音十分直觉,比如图像的像素的颜色表达可以直接量化成数字输入到神经网络中,当然如果是经过压缩的格式jpeg等必须还 ...

随机推荐

Tomcat下ajax请求路径总结
ajax的url有两种,一种是绝对路径,另一种是相对路径. 一.绝对路径:包括协议名称.主机地址.端口.web项目名称等的完整请求路径. 例如: $.ajax({ url:"ht ...
WPF入门(三)->两个几何图形合并(CombinedGeometry)
原文:WPF入门(三)->两个几何图形合并(CombinedGeometry) 在WPF中,提供了一个CombinedGeometry对象可以使两个几何图形合并产生效果 CombinedGeom ...
[GeekBand] C++ 内存分布—— new和delete重载的实现及分析
本文参考文献:GeekBand课堂内容,授课老师:侯捷 :深度探索C++对象模型(侯捷译) :网络资料: http://www.leavesite.com/geekband-cpp-5.html ht ...
selenium firefox 提取qq空间相册链接
环境: selenium-java 3.9.1 firefox 57.0 geckodriver 0.19.1 1.大概的思路就是模拟用户点击行为,关于滚动条的问题,我是模拟下拉箭头,否则只能每个相册 ...
【38.46%】【codeforces 615E】Hexagons
time limit per test 1 second memory limit per test 256 megabytes input standard input output standar ...
【28.57%】【codeforces 615C】 Running Track
time limit per test1 second memory limit per test512 megabytes inputstandard input outputstandard ou ...
Matlab Tricks（二十四）—— title 置于图像之下（包括 subplots 的情形）
1. 使用 title 的 'position' 属性进行设置 plot(1:10, 1:10), title('y=x', 'position', [5.5, 0]) 2. 使用 xlabel pl ...
message contains no documents code:13066 mongdb数据库报的错误
message contains no documents code:13066stackoverflow上面的回答是: What version of the C# driver are you ...
关于java中继承抽象类和实现接口的区别
简单来说,继承就是“是不是”,实现就是“有没有”.(一个大神说的,我觉得很生动很形象海子大神链接http://www.cnblogs.com/dolphin0520/p/3811437.html)
Efficient store queue architecture
One embodiment of the present invention provides a store queue that applies the stores to a memory s ...

Tensorflow中循环神经网络及其Wrappers

Tensorflow中循环神经网络及其Wrappers的更多相关文章

随机推荐

热门专题