keras Model 3 共享的层

考虑这样的一个问题：我们要判断连个tweet是否来源于同一个人。

首先我们对两个tweet进行处理，然后将处理的结构拼接在一起，之后跟一个逻辑回归，输出这两条tweet来自同一个人概率。

因为我们对两条tweet的处理是相同的，所以对第一条tweet的处理的模型，可以被重用来处理第二个tweet。我们考虑用LSTM进行处理。

假设我们的输入是两条 280*256的向量

首先定义输入：

import keras

from keras.layers import Input, LSTM, Dense

from keras.models import Model

tweet_a = Input(shape=(280, 256))

tweet_b = Input(shape=(280, 256))

然后我们共享LSTM。共享层很简单，只要实例化层一次，然后在你想处理的tensor上调用你想要应用的次数即可（翻译无力，看代码）

# This layer can take as input a matrix

# and will return a vector of size 64

shared_lstm = LSTM(64)

# When we reuse the same layer instance

# multiple times, the weights of the layer

# are also being reused

# (it is effectively *the same* layer)

encoded_a = shared_lstm(tweet_a)

encoded_b = shared_lstm(tweet_b)

# We can then concatenate the two vectors:

merged_vector = keras.layers.concatenate([encoded_a, encoded_b], axis=-1)

# And add a logistic regression on top

predictions = Dense(1, activation='sigmoid')(merged_vector)

# We define a trainable model linking the

# tweet inputs to the predictions

model = Model(inputs=[tweet_a, tweet_b], outputs=predictions)

model.compile(optimizer='rmsprop',

              loss='binary_crossentropy',

              metrics=['accuracy'])

model.fit([data_a, data_b], labels, epochs=10)

其实，简单点说，对一个层的多次调用，就是在共享这个层。这里有一个层的节点的概念

当你在一个输入tensor上调用一个层时，就会生成一个输出tensor，就会在这个层上添加一个节点，这个节点连接着这两个tensor（输入tensor和输出tensor）。当你多次调用同一个层的时，

这个层生成的节点就会按照0 ，1, 2，。。以此类推编号。

那么当一个层有多个节点的时候，我们怎么获取它的输出呢？

如果直接通过output获取会出错：

a = Input(shape=(280, 256))

b = Input(shape=(280, 256))

lstm = LSTM(32)

encoded_a = lstm(a)

encoded_b = lstm(b)

lstm.output

>> AttributeError: Layer lstm_1 has multiple inbound nodes,

hence the notion of "layer output" is ill-defined.

Use `get_output_at(node_index)` instead.

这时候应该通过索引进行调用：

assert lstm.get_output_at(0) == encoded_a

assert lstm.get_output_at(1) == encoded_b

对于输入，也是同样的

a = Input(shape=(32, 32, 3))

b = Input(shape=(64, 64, 3))

conv = Conv2D(16, (3, 3), padding='same')

conved_a = conv(a)

# Only one input so far, the following will work:

assert conv.input_shape == (None, 32, 32, 3)

conved_b = conv(b)

# now the `.input_shape` property wouldn't work, but this does:

assert conv.get_input_shape_at(0) == (None, 32, 32, 3)

assert conv.get_input_shape_at(1) == (None, 64, 64, 3)

keras Model 3 共享的层的更多相关文章

Problem after converting keras model into Tensorflow pb - 将keras模型转换为Tensorflow pb后的问题
I'm using keras 2.1.* with tensorflow 1.13.* backend. I save my model during training with .h5 forma ...
Deploying Keras model on Tensorflow Serving--
keras训练了个二分类的模型.需求是把keras模型跑到 tensorflow serving上 (TensorFlow Serving 系统用于在生产环境中运行模型) keras模型转 tenso ...
tensorflow 2.0 技巧 | 自定义tf.keras.Model的坑
自定义tf.keras.Model需要注意的点 model.save() subclass Model 是不能直接save的,save成.h5,但是能够save_weights,或者save_form ...
keras Model 2 多输入和输出
1 入门 2 多个输入和输出 3 共享层函数式模型有一个很好用的应用实例是:编写拥有多个输入和输出的模型.函数式模型使得在复杂网络中操作巨大的数据流变的简单. 我们实现下面这样的模型 from ke ...
keras Model 1 入门篇
1 入门 2 多个输入和输出 3 共享层最近在学习keras,它有一些实现好的特征提取的模型:resNet.vgg.而且是带权重的.用来做特诊提取比较方便首先要知道keras有两种定义模型的方式: ...
Keras Model Sequential模型接口
Sequential 模型 API 在阅读这片文档前,请先阅读 Keras Sequential 模型指引. Sequential 模型方法 compile compile(optimizer, lo ...
keras model.compile(loss='目标函数 ', optimizer='adam', metrics=['accuracy'])
深度学习笔记目标函数的总结与整理目标函数,或称损失函数,是网络中的性能函数,也是编译一个模型必须的两个参数之一.由于损失函数种类众多,下面以keras官网手册的为例. 在官方keras.io里 ...
bootstrapt model 的多罩层，禁用罩层
选项有一些选项可以用来定制模态窗口(Modal Window)的外观和感观,它们是通过 data 属性或 JavaScript 来传递的.下表列出了这些选项: 选项名称类型/默认值 Data 属性 ...
tensorflow2.0编程规范
背景 tensorflow2.0 相比于1.0 有很大变化,1.0版本的placeholder,Session都没有了,2.0版本强推使用keras.keras是一个比较高层的api,确实挺好用的,一 ...

随机推荐

django(模版)
官方文档:https://docs.djangoproject.com/en/1.11/ref/templates/language/ 常用语法 Django模板中只需要记两种特殊符号: {{ }} ...
linux reboot ,shutdown,halt区别
reboot ,shutdown,halt区别重启 reboot 和 shutdown -r now 效果是一样的都是重启区别在于reboot 是重启时,删除所有的进程,为不是平稳的终止他 ...
Bash基础——命令替换
参考:Linux 下Shell 脚本几种基本命令替换区别 Command substitution 命令替换Command substitution https://www.jb51.net/arti ...
Vue + SpringBoot 前后端分离打包部署遇到的坑
1. 在vue项目的目录下,用npm run build 生成dist目录,将目录下的static和index.html复制到SpringBoot项目下的resource目录下这个时候发现启动Spr ...
apache配置https加密传输
环境:两台linux虚拟机和一台windows本机,一台充当要使用https传输的web服务器apache2.4.4,另一台CA服务器,window测试https配置. 1.CA服务器生成私有CA 1 ...
Nmap一些参数的具体作用
目标说明 1234 -iL <inputfilename> 读取文档-iR <hostnum> 随机选择目标--exclude <host1[,host2][,...]& ...
前端知识总结--html
1. doctype的作用是什么? <!DOCTYPE> 声明必须是 HTML 文档的第一行,位于 <html> 标签之前. <!DOCTYPE> 声明不是 HT ...
js闭包随记
理解闭包可以将以上代码分解如下: function outerFunction() { ; function innerFunction(){ return count ...
django-haystack 安装No local packages or working download links found for setuptools_scm
在虚拟环境中安装drf-haystack时,pip报错 Liang-2:~ langying$ pip install django-haystack Collecting django-haysta ...
c语言数组越界的避免方法
1.尽量显式地指定数组的边界 #define MAX 10 - int a[MAX]={1,2,3,4,5,6,7,8,9,10}; 在 C99 标准中,还允许我们使用单个指示符为数组的两段" ...

keras Model 3 共享的层

keras Model 3 共享的层的更多相关文章

随机推荐

热门专题