Keras（六）Autoencoder 自编码原理及实例 Save&reload 模型的保存和提取

原文链接：http://www.one2know.cn/keras7/

Autoencoder 自编码

压缩与解压

原来有时神经网络要接受大量的输入信息, 比如输入信息是高清图片时, 输入信息量可能达到上千万, 让神经网络直接从上千万个信息源中学习是一件很吃力的工作. 所以, 何不压缩一下, 提取出原图片中的最具代表性的信息, 缩减输入信息量, 再把缩减过后的信息放进神经网络学习. 这样学习起来就简单轻松了. 所以, 自编码就能在这时发挥作用. 通过将原数据白色的X 压缩, 解压成黑色的X, 然后通过对比黑白 X ,求出预测误差, 进行反向传递, 逐步提升自编码的准确性. 训练好的自编码中间这一部分就是能总结原数据的精髓. 可以看出, 从头到尾, 我们只用到了输入数据 X, 并没有用到 X 对应的数据标签, 所以也可以说自编码是一种非监督学习. 到了真正使用自编码的时候. 通常只会用到自编码前半部分
Encoder 编码器

编码器能得到原数据的精髓, 然后我们只需要再创建一个小的神经网络学习这个精髓的数据,不仅减少了神经网络的负担, 而且同样能达到很好的效果

自编码能从原数据中总结出每种类型数据的特征, 如果把这些特征类型都放在一张二维的图片上, 每种类型都已经被很好的用原数据的精髓区分开来. 如果你了解 PCA 主成分分析, 再提取主要特征时, 自编码和它一样,甚至超越了 PCA. 换句话说, 自编码可以像 PCA 一样给特征属性降维
Decoder 解码器

将精髓信息解压成原始信息
实例

把 datasets.mnist 数据的 28×28＝784 维的数据，压缩成 2 维的数据，然后在一个二维空间中可视化出分类的效果

import numpy as np

np.random.seed(1)

from keras.datasets import mnist

from keras.models import Model

from keras.layers import Dense, Input

import matplotlib.pyplot as plt

# 获取数据 非监督学习 不用y

(x_train, _), (x_test, y_test) = mnist.load_data()

# 预处理

x_train = x_train.astype('float32') / 255. - 0.5 # 标准化 -0.5~0.5

x_test = x_test.astype('float32') / 255. - 0.5

x_train = x_train.reshape((x_train.shape[0], -1))

x_test = x_test.reshape((x_test.shape[0], -1))

# print(x_train.shape)

# print(x_test.shape)

# 要压成的维度

encoding_dim = 2

# 原来的图片数据大小

input_img = Input(shape=(784,))

## 建立神经网路

# 编码层

encoded = Dense(128, activation='relu')(input_img)

encoded = Dense(64, activation='relu')(encoded)

encoded = Dense(10, activation='relu')(encoded)

encoder_output = Dense(encoding_dim)(encoded)

# 解码层

decoded = Dense(10, activation='relu')(encoder_output)

decoded = Dense(64, activation='relu')(decoded)

decoded = Dense(128, activation='relu')(decoded)

decoded = Dense(784, activation='tanh')(decoded)

# 构建自动编码模型

autoencoder = Model(input=input_img, output=decoded)

# 激活模型

autoencoder.compile(optimizer='adam', loss='mse')

# 训练 非监督学习 经历压缩和解压的自己跟原来的自己比较

autoencoder.fit(x_train, x_train,epochs=20,batch_size=256,shuffle=True)

# 可视化结果

encoded_imgs = autoencoder.predict(x_test)

plt.scatter(encoded_imgs[:, 0], encoded_imgs[:, 1], c=y_test)

plt.colorbar()

plt.show()

输出：

Epoch 1/20

  256/60000 [..............................] - ETA: 1:41 - loss: 0.2318

 1280/60000 [..............................] - ETA: 22s - loss: 0.2211

。。。

59648/60000 [============================>.] - ETA: 0s - loss: 0.0393

60000/60000 [==============================] - 2s 41us/step - loss: 0.0393

Save&reload 保存提取

保存模型

训练完模型之后

from keras.models import save_model

model.save('my_model.h5)
导入模型

导入保存好的模型

from keras.models import load_model

model = load_model(my_model.h5)

还可以只保存权重，不保存模型结构

model.save_weights('my_model_weights.h5')

model.load_weights('my_model_weights.h5')

还可以用model.to_json 保存完结构之后，然后再去加载这个json_string，只保存结构，没保存权重

from keras.models import model_from_json

json_string = model.to_json()

model = model_from_json(json_string)

Keras（六）Autoencoder 自编码原理及实例 Save&reload 模型的保存和提取的更多相关文章

用Keras搭建神经网络简单模版（六）——Autoencoder 自编码
import numpy as np np.random.seed(1337) from keras.datasets import mnist from keras.models import Mo ...
google protocol buffer——protobuf的编码原理二
这一系列文章主要是对protocol buffer这种编码格式的使用方式.特点.使用技巧进行说明,并在原生protobuf的基础上进行扩展和优化,使得它能更好地为我们服务. 在上一篇文章中,我们主要通 ...
Wordpress解析系列之PHP编写hook钩子原理简单实例
Wordpress作为全球应用最广泛的个人博客建站工具,有很多的技术架构值得我们学习推敲.其中,最著名最经典的编码技术架构就是采用了hook的机制. hook翻译成中文是钩子的意思,单独看这个词我们难 ...
一篇文章彻底弄懂Base64编码原理
在互联网中的每一刻,你可能都在享受着Base64带来的便捷,但对于Base64的基础原理又了解多少?今天这篇博文带领大家了解一下Base64的底层实现. Base64的由来目前Base64已经成为网 ...
4B/5B编码原理
4B/5B编码原理什么是4B/5B编码? 4B/5B编码是百兆以太网(即快速以太网)中线路层编码类型之一,就是用5bit的二进制数来表示4bit二进制数,映射方式如下表所示: 为什么要进行4B/5B ...
知识扩展——(转)一篇文章彻底弄懂Base64编码原理
在互联网中的每一刻,你可能都在享受着Base64带来的便捷,但对于Base64的基础原理又了解多少?今天这篇博文带领大家了解一下Base64的底层实现. 一.Base64的由来目前Base64已经成 ...
MATLAB神经网络原理与实例精解视频教程
教程内容:<MATLAB神经网络原理与实例精解>随书附带源程序.rar9.随机神经网络.rar8.反馈神经网络.rar7.自组织竞争神经网络.rar6.径向基函数网络.rar5.BP神经网 ...
Base64编码原理与应用
本文内容转自网络,如需详细内容,请参考相关网址. http://my.oschina.net/goal/blog/201032 代码参考:http://blog.csdn.net/prsniper/a ...
Camera图像处理原理及实例分析-重要图像概念
Camera图像处理原理及实例分析作者:刘旭晖 colorant@163.com 转载请注明出处 BLOG:http://blog.csdn.net/colorant/ 主页:http://rg ...

随机推荐

8 NLP-自然语言处理Demo
1 NLP(自然语言处理) 1.1相似度相似度和距离之间关系: 1.文本相似度: 1) 语义相似.但字面不相似: 老王的个人简介铁王人物介绍 2) 字面相似.但是语义不相似: 我吃饱饭了我吃不饱 ...
【Android】未引入包问题
Mac 上配置 Android 开发环境,遇到了下面问题: /Users/***/Documents/SVN/Android/***/1.0.3/res/values/styles.xml:21: e ...
OI/ACM最全卡常大招
NO.10: 循环展开: 在缓存和寄存器允许的情况下一条语句内大量的展开运算会刺激 CPU 并发(蛤?这是个什么原理,算了,反正写了没坏处就这么写吧) NO.9: 特殊运算优化:(或许这真的没用) 取 ...
Maven安装和配置环境变量
Maven配置 1.下载下载maven 3.5.4 先到官网http://maven.apache.org/download.cgi 下载最新版本(目前是3.5.4 ),下载完成后,解压到某个目录( ...
C#中属性的解析
一.域的概念 C#中域是指成员变量和方法,在OOP编程中(面向对象编程)我们要求用户只知道类是干什么的,而不许知道如何完成的,或者说不允许访问类的内部,对于有必要在类外可见的域,我们用属性来表达,所以 ...
http测试工具
http测试工具: https://github.com/denji/awesome-http-benchmark wrk https://github.com/wg/wrk wrk2 https:/ ...
Leader-Follower线程模型简介
参考58沈剑大神架构师之路上的文章,谈谈Leader-Follower线程模型: 上图就是L/F多线程模型的状态变迁点,共6个关键点: (1)线程有3种状态:领导leading,处理processin ...
python调用支付宝支付接口
python调用支付宝支付接口详细示例—附带Django demo代码项目演示: 一.输入金额二.跳转到支付宝付款三.支付成功四.跳转回自己网站在使用支付宝接口的前期准备: 1.支付宝公 ...
8.15 day33 进程池与线程池_协程_IO模型(了解)
进程池和线程池开进程开线程都需要消耗资源,只不过两者比较的情况线程消耗的资源比较少在计算机能够承受范围之内最大限度的利用计算机什么是池? 在保证计算机硬件安全的情况下最大限度地利用计算机 ...
OSI七层网络模型与TCP/IP四层模型
1.OSI七层结构图: 2.TCP/IP四层结构图: 3.各层对应的协议 4.OSI七层和TCP/IP四层的区别 OSI网络模型和TCP/IP网络模型对应关系: 5.交换机工作在OSI的哪一层如果有 ...

Keras（六）Autoencoder 自编码 原理及实例 Save&reload 模型的保存和提取

Autoencoder 自编码

Save&reload 保存提取

Keras（六）Autoencoder 自编码 原理及实例 Save&reload 模型的保存和提取的更多相关文章

随机推荐

热门专题

Keras（六）Autoencoder 自编码原理及实例 Save&reload 模型的保存和提取

Keras（六）Autoencoder 自编码原理及实例 Save&reload 模型的保存和提取的更多相关文章