TensorFlow搭建模型方式总结

引言

TensorFlow提供了多种API，使得入门者和专家可以根据自己的需求选择不同的API搭建模型。

基于Keras Sequential API搭建模型

Sequential适用于线性堆叠的方式搭建模型，即每层只有一个输入和输出。

import tensorflow as tf

# 导入手写数字数据集

mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据标准化

x_train, x_test = x_train/255, x_test/255

# 使用Sequential搭建模型

# 方式一

model = tf.keras.models.Sequential([

    # 加入CNN层(2D), 使用了3个卷积核, 卷积核的尺寸为3X3, 步长为1, 输入图像的维度为28X28X1

    tf.keras.layers.Conv2D(3, kernel_size=3, strides=1, input_shape=(28, 28, 1)),

    # 加入激活函数

    tf.keras.layers.Activation('relu'),

    # 加入2X2池化层, 步长为2

    tf.keras.layers.MaxPool2D(pool_size=2, strides=2),

    # 把图像数据平铺

    tf.keras.layers.Flatten(),

    # 加入全连接层, 设置神经元为128个, 设置relu激活函数

    tf.keras.layers.Dense(128, activation='relu'),

    # 加入全连接层(输出层), 设置输出数量为10, 设置softmax激活函数

    tf.keras.layers.Dense(10, activation='softmax')

])

# 方式二

model2 = tf.keras.models.Sequential()

model2.add(tf.keras.layers.Conv2D(3, kernel_size=3, strides=1, input_shape=(28, 28, 1)))

model2.add(tf.keras.layers.Activation('relu'))

model2.add(tf.keras.layers.MaxPool2D(pool_size=2, strides=2))

model2.add(tf.keras.layers.Flatten())

model2.add(tf.keras.layers.Dense(128, activation='relu'))

model2.add(tf.keras.layers.Dense(10, activation='softmax'))

# 模型概览

model.summary()

"""

Model: "sequential"

_________________________________________________________________

 Layer (type)                Output Shape              Param #

=================================================================

 conv2d (Conv2D)             (None, 26, 26, 3)         30        

 activation (Activation)     (None, 26, 26, 3)         0         

 max_pooling2d (MaxPooling2D  (None, 13, 13, 3)        0

 )                                                               

 flatten (Flatten)           (None, 507)               0         

 dense (Dense)               (None, 128)               65024     

 dense_1 (Dense)             (None, 10)                1290      

=================================================================

Total params: 66,344

Trainable params: 66,344

"""

# 编译 为模型加入优化器, 损失函数, 评估指标

model.compile(

    optimizer='adam',

    loss='sparse_categorical_crossentropy',

    metrics=['accuracy']

)

# 训练模型, 2个epoch, batch size为100

model.fit(x_train, y_train, epochs=2, batch_size=100)

基于Keras 函数API搭建模型

由于Sequential是线性堆叠的，只有一个输入和输出，但是当我们需要搭建多输入模型时，如输入图片、文本描述等，这几类信息可能需要分别使用CNN，RNN模型提取信息，然后汇总信息到最后的神经网络中预测输出。或者是多输出任务，如根据音乐预测音乐类型和发行时间。亦或是一些非线性的拓扑网络结构模型，如使用残差链接、Inception等。上述这些情况的网络都不是线性搭建，要搭建如此复杂的网络，需要使用函数API来搭建。

简单实例

import tensorflow as tf

# 导入手写数字数据集

mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据标准化

x_train, x_test = x_train/255, x_test/255

input_tensor = tf.keras.layers.Input(shape=(28, 28, 1))

# CNN层(2D), 使用了3个卷积核, 卷积核的尺寸为3X3, 步长为1, 输入图像的维度为28X28X1

x = tf.keras.layers.Conv2D(3, kernel_size=3, strides=1)(input_tensor)

# 激活函数

x = tf.keras.layers.Activation('relu')(x)

# 2X2池化层, 步长为2

x = tf.keras.layers.MaxPool2D(pool_size=2, strides=2)(x)

# 把图像数据平铺

x = tf.keras.layers.Flatten()(x)

# 全连接层, 设置神经元为128个, 设置relu激活函数

x = tf.keras.layers.Dense(128, activation='relu')(x)

# 全连接层(输出层), 设置输出数量为10, 设置softmax激活函数

output = tf.keras.layers.Dense(10, activation='softmax')(x)

model = tf.keras.models.Model(input_tensor, output)

# 模型概览

model.summary()

"""

Model: "model"

_________________________________________________________________

 Layer (type)                Output Shape              Param #

=================================================================

 input_1 (InputLayer)        [(None, 28, 28, 1)]       0         

 conv2d (Conv2D)             (None, 26, 26, 3)         30        

 activation (Activation)     (None, 26, 26, 3)         0         

 max_pooling2d (MaxPooling2D  (None, 13, 13, 3)        0

 )                                                               

 flatten (Flatten)           (None, 507)               0         

 dense (Dense)               (None, 128)               65024     

 dense_1 (Dense)             (None, 10)                1290      

=================================================================

Total params: 66,344

Trainable params: 66,344

Non-trainable params: 0

_________________________________________________________________

"""

# 编译 为模型加入优化器, 损失函数, 评估指标

model.compile(

    optimizer='adam',

    loss='sparse_categorical_crossentropy',

    metrics=['accuracy']

)

# 训练模型, 2个epoch, batch size为100

model.fit(x_train, y_train, epochs=2, batch_size=100)

多输入实例

import tensorflow as tf

# 输入1

input_tensor1 = tf.keras.layers.Input(shape=(28,))

x1 = tf.keras.layers.Dense(16, activation='relu')(input_tensor1)

output1 = tf.keras.layers.Dense(32, activation='relu')(x1)

# 输入2

input_tensor2 = tf.keras.layers.Input(shape=(28,))

x2 = tf.keras.layers.Dense(16, activation='relu')(input_tensor2)

output2 = tf.keras.layers.Dense(32, activation='relu')(x2)

# 合并输入1和输入2

concat = tf.keras.layers.concatenate([output1, output2])

# 顶层分类模型

output = tf.keras.layers.Dense(10, activation='relu')(concat)

model = tf.keras.models.Model([input_tensor1, input_tensor2], output)

# 编译

model.compile(

    optimizer='adam',

    loss='sparse_categorical_crossentropy',

    metrics=['accuracy']

)

多输出实例

import tensorflow as tf

# 输入

input_tensor = tf.keras.layers.Input(shape=(28,))

x = tf.keras.layers.Dense(16, activation='relu')(input_tensor)

output = tf.keras.layers.Dense(32, activation='relu')(x)

# 多个输出

output1 = tf.keras.layers.Dense(10, activation='relu')(output)

output2 = tf.keras.layers.Dense(1, activation='sigmoid')(output)

model = tf.keras.models.Model(input_tensor, [output1, output2])

# 编译

model.compile(

    optimizer='adam',

    loss=['sparse_categorical_crossentropy', 'binary_crossentropy'],

    metrics=['accuracy']

)

子类化API

相较于上述使用高阶API，使用子类化API的方式来搭建模型，可以根据需求对模型中的任何一部分进行修改。

import tensorflow as tf

# 导入手写数字数据集

mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据标准化

x_train, x_test = x_train / 255, x_test / 255

train_data = tf.data.Dataset.from_tensor_slices((x_train, y_train)).shuffle(buffer_size=10).batch(32)

test_data = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(32)

class MyModel(tf.keras.Model):

    def __init__(self):

        super(MyModel, self).__init__()

        self.flatten = tf.keras.layers.Flatten()

        self.hidden_layer1 = tf.keras.layers.Dense(16, activation='relu')

        self.hidden_layer2 = tf.keras.layers.Dense(10, activation='softmax')

    # 定义模型

    def call(self, x):

        h = self.flatten(x)

        h = self.hidden_layer1(h)

        y = self.hidden_layer2(h)

        return y

model = MyModel()

# 损失函数 和 优化器

loss_function = tf.keras.losses.SparseCategoricalCrossentropy()

optimizer = tf.keras.optimizers.Adam()

# 评估指标

train_loss = tf.keras.metrics.Mean()  # 一个epoch的loss

train_accuracy = tf.keras.metrics.SparseCategoricalAccuracy()  # 一个epoch的准确率

test_loss = tf.keras.metrics.Mean()

test_accuracy = tf.keras.metrics.SparseCategoricalAccuracy()

@tf.function

def train_step(x, y):

    with tf.GradientTape() as tape:

        y_pre = model(x)

        loss = loss_function(y, y_pre)

    grad = tape.gradient(loss, model.trainable_variables)

    optimizer.apply_gradients(zip(grad, model.trainable_variables))

    train_loss(loss)

    train_accuracy(y, y_pre)

@tf.function

def test_step(x, y):

    y_pre = model(x)

    te_loss = loss_function(y, y_pre)

    test_loss(te_loss)

    test_accuracy(y, y_pre)

epoch = 2

for i in range(epoch):

    # 重置评估指标

    train_loss.reset_states()

    train_accuracy.reset_states()

    # 按照batch size 进行训练

    for x, y in train_data:

        train_step(x, y)

    print(f'epoch {i+1} train loss {train_loss.result()} train accuracy {train_accuracy.result()}')

参考

TensorFlow官方文档

TensorFlow搭建模型方式总结的更多相关文章

用TensorFlow搭建一个万能的神经网络框架（持续更新）
我一直觉得TensorFlow的深度神经网络代码非常困难且繁琐,对TensorFlow搭建模型也十分困惑,所以我近期阅读了大量的神经网络代码,终于找到了搭建神经网络的规律,各位要是觉得我的文章对你有帮 ...
（转）一文学会用 Tensorflow 搭建神经网络
一文学会用 Tensorflow 搭建神经网络本文转自:http://www.jianshu.com/p/e112012a4b2d 字数2259 阅读3168 评论8 喜欢11 cs224d-Day ...
tensorflow机器学习模型的跨平台上线
在用PMML实现机器学习模型的跨平台上线中,我们讨论了使用PMML文件来实现跨平台模型上线的方法,这个方法当然也适用于tensorflow生成的模型,但是由于tensorflow模型往往较大,使用无法 ...
一文学会用 Tensorflow 搭建神经网络
http://www.jianshu.com/p/e112012a4b2d 本文是学习这个视频课程系列的笔记,课程链接是 youtube 上的,讲的很好,浅显易懂,入门首选, 而且在github有代码 ...
[DL学习笔记]从人工神经网络到卷积神经网络_3_使用tensorflow搭建CNN来分类not_MNIST数据(有一些问题)
3:用tensorflow搭个神经网络出来为什么用tensorflow呢,应为谷歌是亲爹啊,虽然有些人说caffe更适合图像啊mxnet效率更高等等,但爸爸就是爸爸,Android都能那么火,一个道 ...
TensorFlow-Bitcoin-Robot:一个基于 TensorFlow LSTM 模型的 Bitcoin 价格预测机器人
简介 TensorFlow-Bitcoin-Robot:一个基于 TensorFlow LSTM 模型的 Bitcoin 价格预测机器人. 文章包括一下几个部分: 1.为什么要尝试做这个项目? 2.为 ...
用Tensorflow搭建神经网络的一般步骤
用Tensorflow搭建神经网络的一般步骤如下: ① 导入模块 ② 创建模型变量和占位符 ③ 建立模型 ④ 定义loss函数 ⑤ 定义优化器(optimizer), 使 loss 达到最小 ⑥ 引入 ...
『TensorFlow』模型保存和载入方法汇总
『TensorFlow』第七弹_保存&载入会话_霸王回马一.TensorFlow常规模型加载方法保存模型 tf.train.Saver()类,.save(sess, ckpt文件目录)方法 ...
Python之TensorFlow的模型训练保存与加载-3
一.TensorFlow的模型保存和加载,使我们在训练和使用时的一种常用方式.我们把训练好的模型通过二次加载训练,或者独立加载模型训练.这基本上都是比较常用的方式. 二.模型的保存与加载类型有2种 1 ...

随机推荐

python os相关操作
python os模块常用操作什么时候使用os模块? 操作文件及文件夹(对于文件及文件夹的增删改查) 1.获取当前文件夹的工作目录注意不是当前文件所在文件,即当前执行python文件的文件夹 pr ...
快速新建并配置一个eslint+prettier+husky+commitlint+vue3+vite+ts+pnpm的项目
前置准备一台电脑 vscode pnpm vscode插件:ESLint v2.2.6及以上 vscode插件:Prettier - Code formatter v9.5.0及以上 vscode插 ...
MySQL主从复制之半同步(semi-sync replication)
GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 半同步简介 MASTER节点在执行完客户端提交的事务后不是立刻返回结果给客户端,而是等待至少一个SLAVE节点接收并写到r ...
Java基础 | Stream流原理与用法总结
Stream简化元素计算: 一.接口设计从Java1.8开始提出了Stream流的概念,侧重对于源数据计算能力的封装,并且支持序列与并行两种操作方式:依旧先看核心接口的设计: BaseStream: ...
R数据分析：用R建立预测模型
预测模型在各个领域都越来越火,今天的分享和之前的临床预测模型背景上有些不同,但方法思路上都是一样的,多了解各个领域的方法应用,视野才不会被局限. 今天试图再用一个实例给到大家一个统一的预测模型的做法框 ...
Java中数组
数组的定义格式: 1: 数据类型[] 数组名 2: 数据类型数组名动态初始化: 初始化的时候系统会默认给数组赋值数据类型[] 变量名 = new 数据类型[数组长度] int[] arr = ...
第八十二篇：Vue购物车(三) 实现全选功能
好家伙, 继续完善购物车相应功能 1.如何实现全选和反全选 1.1.全选框的状态显示(父传子) 来一波合理分析: 在页面中,有三个商品中三个商品中的第二个未选择, 我么使用一个计算属性(fullSt ...
【读书笔记】C#高级编程第十一章 LINQ
(一)LINQ概述语言集成查询(Language Integrated Query,LINQ)在C#编程语言中继承了查询语法,可以用相同的语法访问不同的数据源. 1.LINQ查询 var query ...
字节跳动 DanceCC 工具链系列之Xcode LLDB耗时监控统计方案
作者:李卓立仲凯宁背景介绍在<字节跳动 DanceCC 工具链系列之Swift 调试性能的优化方案>[1]一文中,我们介绍了如何使用自定义的工具链,来针对性优化调试器的性能,解决大型 ...
一文搞懂mysql索引底层逻辑，干货满满！
一.什么是索引在mysql中,索引是一种特殊的数据库结构,由数据表中的一列或多列组合而成,可以用来快速查询数据表中有某一特定值的记录.通过索引,查询数据时不用读完记录的所有信息,而只是查询索引列即可 ...