TensorFlow2.0初体验

TF2.0默认为动态图，即eager模式。意味着TF能像Pytorch一样不用在session中才能输出中间参数值了，那么动态图和静态图毕竟是有区别的，tf2.0也会有写法上的变化。不过值得吐槽的是，tf2.0启动速度仍然比Pytorch慢的多。

操作被记录在磁带中（tape）
这是一个关键的变化。在TF0.x到TF1.X时代，操作（operation）被加入到Graph中。但现在，操作会被梯度带记录，我们要做的仅仅是让前向传播和计算损失的过程发生在梯度带的上下文管理器中。

 with tf.GradientTape() as tape:

        logits = mnist_model(images, training=True)

        loss_value = tf.losses.sparse_softmax_cross_entropy(labels, logits)

            #  loss_value 必须在tape内部

    grads = tape.gradient(loss_value, mnist_model.variables)

    optimizer.apply_gradients(zip(grads, mnist_model.variables),

                            global_step=tf.train.get_or_create_global_step())

注意到这里的tape.gradient用来计算损失函数和model参数的导数。我们在之前的版本要么使用优化器的minimize功能，要么使用tf.gradients来计算导数。在eager模式，tf.gradients不能使用。

# coding: utf-8

# pytorch: loss.backward(), optimizer.step()完成梯度计算和参数更新；

# tf2.0通过： grads = tape.gradient(), optimizer.apply_gradients()来实现！

# reference: https://github.com/aymericdamien/TensorFlow-Examples/blob/master/tensorflow_v2/notebooks/3_NeuralNetworks/convolutional_network.ipynb

from __future__ import absolute_import,division,print_function

import tensorflow as tf

from tensorflow.keras import Model, layers

import numpy as np

# MNIST dataset parameters.

num_classes = 10 # total classes (0-9 digits).

# Training parameters.

learning_rate = 0.001

training_steps = 200

batch_size = 128

display_step = 10

# Network parameters.

conv1_filters = 32 # number of filters for 1st conv layer.

conv2_filters = 64 # number of filters for 2nd conv layer.

fc1_units = 1024 # number of neurons for 1st fully-connected layer.

# Prepare MNIST data.

from tensorflow.keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Convert to float32.

x_train, x_test = np.array(x_train, np.float32), np.array(x_test, np.float32)

# Normalize images value from [0, 255] to [0, 1].

x_train, x_test = x_train / 255., x_test / 255.

# Use tf.data API to shuffle and batch data.

train_data = tf.data.Dataset.from_tensor_slices((x_train, y_train))

train_data = train_data.repeat().shuffle(5000).batch(batch_size).prefetch(1)

# Create TF Model.

class ConvNet(Model):

    # Set layers.

    def __init__(self):

        super(ConvNet, self).__init__()

        # Convolution Layer with 32 filters and a kernel size of 5.

        self.conv1 = layers.Conv2D(32, kernel_size=5, activation=tf.nn.relu)

        # Max Pooling (down-sampling) with kernel size of 2 and strides of 2.

        self.maxpool1 = layers.MaxPool2D(2, strides=2)

        # Convolution Layer with 64 filters and a kernel size of 3.

        self.conv2 = layers.Conv2D(64, kernel_size=3, activation=tf.nn.relu)

        # Max Pooling (down-sampling) with kernel size of 2 and strides of 2.

        self.maxpool2 = layers.MaxPool2D(2, strides=2)

        # Flatten the data to a 1-D vector for the fully connected layer.

        self.flatten = layers.Flatten()

        # Fully connected layer.

        self.fc1 = layers.Dense(1024)

        # Apply Dropout (if is_training is False, dropout is not applied).

        self.dropout = layers.Dropout(rate=0.5)

        # Output layer, class prediction.

        self.out = layers.Dense(num_classes)

    # Set forward pass.

    def call(self, x, is_training=False):

        x = tf.reshape(x, [-1, 28, 28, 1])

        x = self.conv1(x)

        x = self.maxpool1(x)

        x = self.conv2(x)

        x = self.maxpool2(x)

        x = self.flatten(x)

        x = self.fc1(x)

        x = self.dropout(x, training=is_training)

        x = self.out(x)

        if not is_training:

            # tf cross entropy expect logits without softmax, so only

            # apply softmax when not training.

            x = tf.nn.softmax(x)

        return x

# Build neural network model.

conv_net = ConvNet()

# Cross-Entropy Loss.

# Note that this will apply 'softmax' to the logits.

def cross_entropy_loss(x, y):

    # Convert labels to int 64 for tf cross-entropy function.

    y = tf.cast(y, tf.int64)

    # Apply softmax to logits and compute cross-entropy.

    loss = tf.nn.sparse_softmax_cross_entropy_with_logits(labels=y, logits=x)

    # Average loss across the batch.

    return tf.reduce_mean(loss)

# Accuracy metric.

def accuracy(y_pred, y_true):

    # Predicted class is the index of highest score in prediction vector (i.e. argmax).

    correct_prediction = tf.equal(tf.argmax(y_pred, 1), tf.cast(y_true, tf.int64))

    return tf.reduce_mean(tf.cast(correct_prediction, tf.float32), axis=-1)

# Stochastic gradient descent optimizer.

optimizer = tf.optimizers.Adam(learning_rate)

# Optimization process.

def run_optimization(x, y):

    # Wrap computation inside a GradientTape for automatic differentiation.

    with tf.GradientTape() as g:

        # Forward pass.

        pred = conv_net(x, is_training=True)

        # Compute loss.

        loss = cross_entropy_loss(pred, y)

    # Variables to update, i.e. trainable variables.

    trainable_variables = conv_net.trainable_variables

    # Compute gradients.

    gradients = g.gradient(loss, trainable_variables)

    # Update W and b following gradients.

    optimizer.apply_gradients(zip(gradients, trainable_variables))

# Run training for the given number of steps.

for step, (batch_x, batch_y) in enumerate(train_data.take(training_steps), 1):

    # Run the optimization to update W and b values.

    run_optimization(batch_x, batch_y)

    if step % display_step == 0:

        pred = conv_net(batch_x)

        loss = cross_entropy_loss(pred, batch_y)

        acc = accuracy(pred, batch_y)

        print("step: %i, loss: %f, accuracy: %f" % (step, loss, acc))

# Test model on validation set.

pred = conv_net(x_test)

print("Test Accuracy: %f" % accuracy(pred, y_test))

注意：

- TF2.0默认为动态图，没有回话Session了；

- 代码中注意 `for step, (batch_x, batch_y) in enumerate(train_data.take(training_steps), 1):` 的使用；

- Pycharm中注意：from tensorflow.keras import Model, layers ；跳不进去查看内部实现；用面向对象的思想写网络结构；init,build,call等函数实现；

Reference：

TensorFlow2.0初体验的更多相关文章

MySQL8.0初体验
MySQL8.0的官方社区开源版出来有段时间了,而percona的8.0版本还没有正式对外发布(已发布测试版),一直以来也没安装体验下这个号称质的飞跃的版本,今天正好有些时间就下了安装体验体验. 一. ...
VUE 3.0 初体验之路
在2020年9月中旬,vue.js发布了3.0正式版,在不久的将来,VUE3.0 也终将成为大前端的必然趋势, 环境搭建 node 版本要求: Node.js8.9 或更高版本 ,输入 node -v ...
(一) .net core 2.0 初体验
1..net core 2.0环境 .net core 下载地址:https://www.microsoft.com/net/core#windowscmd 问题一:提示[Failed to load ...
【swoole2.0】 PHP + swoole2.0 初体验
背景: centos7 PHP7.1 swoole2.0 准备工作: 一. swoole 扩展安装 1 下载swoole cd /usr/local wget -c https://git ...
vue-cli3.0 初体验
vue-cli3.0 自我记录其实在2018年8月10号,vue-cli3.0就已经面世了,由于项目中应用的全是2.x版本,所以并不了解3.0的vue-cli发生了什么变化,那今天尝试了下遇见的问题 ...
Vue3.0初体验
最近看了Vue3.0的相关信息,相比Vue2.0有以下优点: Performance:性能更比Vue 2.0强. Tree shaking support:可以将无用模块"剪辑", ...
ASP.NET2.0组件控件开发视频初体验
原文:ASP.NET2.0组件控件开发视频初体验 ASP.NET2.0组件控件开发视频初体验录了视频,质量不是很好,大家体验下.我会重新录制的如果不清楚,可以看看http://v.youku. ...
vue.js2.0 自定义组件初体验
理解组件(Component)是 Vue.js 最强大的功能之一.组件可以扩展 HTML 元素,封装可重用的代码.在较高层面上,组件是自定义元素, Vue.js 的编译器为它添加特殊功能.在有些情况 ...
ASP.NET Core 3.0 上的gRPC服务模板初体验(多图)
早就听说ASP.NET Core 3.0中引入了gRPC的服务模板,正好趁着家里电脑刚做了新系统,然后装了VS2019的功夫来体验一把.同时记录体验的过程.如果你也想按照本文的步骤体验的话,那你得先安 ...

随机推荐

vavr：让你像写Scala一样写Java
本文阅读时间大约7分钟. Hystrix是Netflix开源的限流.熔断降级组件,去年发现Hystrix已经不再更新了,而在github主页上将我引导到了另一个替代项目--resilience4j,这 ...
揭秘MySQL主从数据不一致
前言: 目前MySQL数据库最常用的是主从架构,大多数高可用架构也是通过主从架构演变而来.但是主从架构运行时间长久后容易出现数据不一致的情况,比如因从库可写造成的误操作或者复制bug等,本篇文章将会详 ...
号称全站最直观解释-smv核函数-是干啥
认识 svm 在求解时, 通过某非线性变换 φ( x) ,将输入空间映射到高维特征空间.特征空间的维数可能非常高.如果支持向量机的求解只用到内积运算,而在低维输入空间又存在某个函数 K(x, x′) ...
Linux 环境变量配置(Nodejs/MongoDB/JDK/Nginx)
一.环境变量配置注:配置环境变量的文件全局变量(系统级别): /etc/bashrc /etc/profile /etc/environment 用户变量(用户级别): ~/.bash_profi ...
.Net core3.0 集成swagger5.0上传文件
.Net core 3.0已经更新了,相信有挺多博主大佬们都更新了如何在.Net core3.0使用swagger,这里就不详细说了. 我们知道,如果.net core 2.x使用swagger上传文 ...
prometheus学习系列十一： Prometheus 报警规则配置
prometheus监控系统的的报警规则是在prometheus这个组件完成配置的. prometheus支持2种类型的规则,记录规则和报警规则, 记录规则主要是为了简写报警规则和提高规则复用的, 报 ...
Python：基础复习
一.数据类型对象的三大特征:值.身份.类型: 1)数字 Number 整型.浮点型只有 int 和 float 两种类型: type(2/2):float 类型:2/2 == 1.0: type( ...
springboot 集成百度的唯一ID生成器
UidGenerator是百度开源的Java语言实现,基于Snowflake算法的唯一ID生成器.而且,它非常适合虚拟环境,比如:Docker.另外,它通过消费未来时间克服了雪花算法的并发限制.Uid ...
js 压缩图片上传
感谢,参考了以下作者的绝大部分内容 https://blog.csdn.net/tangxiujiang/article/details/78755292 https://blog.csdn.net/ ...
【P1889】SOLDIERS （中位数）
题目描述在一个划分成网格的操场上, n个士兵散乱地站在网格点上.由整数坐标 (x,y) 表示.士兵们可以沿网格边上.下左右移动一步,但在同时刻任一网格点上只能有名士兵.按照军官的命令,们要整齐地列 ...

TensorFlow2.0初体验

Reference：

TensorFlow2.0初体验的更多相关文章

随机推荐

热门专题