GAN——生成手写数字

《Generative Adversarial Nets》是 GAN 系列的鼻祖。在这里通过 PyTorch 实现 GAN ，并且用于手写数字生成。

摘要： 我们提出了一个新的框架，通过对抗处理来评估生成模型。其中，我们同时训练两个 model ：一个是生成模型 G，用于获取数据分布；另一个是判别模型 D，用来预测样本来自训练数据而不是生成模型 G 的概率。G 的训练过程是最大化 D 犯错的概率。这个框架对应于一个极小极大的二人游戏。在任意函数 G 和 D 的空间中，存在着一个唯一的解，G 恢复训练数据的分布而 D 一直等于1/2. 在 G 和 D 都由多层感知器定义的情况下，整个系统可以通过反向传播进行训练。　　

import time

import numpy as np

import torch

import torch.nn.functional as F

from torchvision import datasets

from torchvision import transforms

import torch.nn as nn

from torch.utils.data import DataLoader

if torch.cuda.is_available():

    torch.backends.cudnn.deterministic = True

要导入的包

#########################

## SETTINGS

#########################

# Device

device = torch.device("cuda:2" if torch.cuda.is_available() else "cpu")

# Hyperparameters

random_seed = 123

generator_learning_rate = 0.001

discriminator_learning_rate = 0.001

num_epochs = 100

batch_size = 128

LATENT_DIM = 100

IMG_SHAPE = (1, 28, 28)

IMG_SIZE = 1

for x in IMG_SHAPE:

    IMG_SIZE *= x

设置超参数

#########################

## MNIST DATASET

#########################

train_dataset = datasets.MNIST(root='../data',

                               train=True,

                               transform=transforms.ToTensor(),

                               download=True)

test_dataset = datasets.MNIST(root='../data',

                              train=False,

                              transform=transforms.ToTensor())

train_loader = DataLoader(dataset=train_dataset,

                          batch_size=batch_size,

                          shuffle=True)

test_loader = DataLoader(dataset=test_dataset,

                         batch_size=batch_size,

                         shuffle=False)

# Checking the dataset

for images, labels in train_loader:

    print('Image batch dimensions:', images.shape)

    print('Image label dimensions:', labels.shape)

    break

# 输出

# Image batch dimensions: torch.Size([128, 1, 28, 28])

# Image label dimensions: torch.Size([128])

加载MNIST数据集

##############################

## MODEL

##############################

class GAN(torch.nn.Module):

    def __init__(self):

        super(GAN, self).__init__()

        self.generator = nn.Sequential(

            nn.Linear(LATENT_DIM, 128),

            nn.LeakyReLU(inplace=True),

            nn.Dropout(p=0.5),

            nn.Linear(128, IMG_SIZE),

            nn.Tanh()

        )

        self.discriminator = nn.Sequential(

            nn.Linear(IMG_SIZE, 128),

            nn.LeakyReLU(inplace=True),

            nn.Dropout(p=0.5),

            nn.Linear(128, 1),

            nn.Sigmoid()

        )

    def generator_forward(self, z):

        img = self.generator(z)

        return img

    def discriminator_forward(self, img):

        pred = model.discriminator(img)

        return pred.view(-1)

GAN—Model

start_time = time.time()

discr_costs = []

gener_costs = []

for epoch in range(num_epochs):

    model = model.train()

    for batch_idx, (features, targets) in enumerate(train_loader):

        features = (features - 0.5) * 2.

        features = features.view(-1, IMG_SIZE).to(device)

        targets = targets.to(device)

        # Adversarial ground truths

        valid = torch.ones(targets.size(0)).float().to(device)

        fake = torch.zeros(targets.size(0)).float().to(device)

        ### FORWARD AND BACK PROP

        # ---------------------

        # Train Generator

        # ---------------------

        # make new images

        z = torch.zeros((targets.size(0), LATENT_DIM)).uniform_(-1.0, 1.0).to(device)

        # generate a batch of images

        generated_features = model.generator_forward(z)

        # Loss measures generators's ability to fool the discriminator

        discr_pred = model.discriminator_forward(generated_features)

        gener_loss = F.binary_cross_entropy(discr_pred, valid)

        optim_gener.zero_grad()

        gener_loss.backward()

        optim_gener.step()

        # ---------------------

        # Train Discriminator

        # ---------------------

        # Measure discriminator's ability to classify real from samples

        discr_pred_real = model.discriminator_forward(features.view(-1, IMG_SIZE))

        real_loss = F.binary_cross_entropy(discr_pred_real, valid)

        discr_pred_fake = model.discriminator_forward(generated_features.detach())

        fake_loss = F.binary_cross_entropy(discr_pred_fake, fake)

        discr_loss = 0.5 * (real_loss + fake_loss)

        optim_discr.zero_grad()

        discr_loss.backward()

        optim_discr.step()

        discr_costs.append(discr_loss)

        gener_costs.append(gener_loss)

        ### LOGGING

        if not batch_idx % 100:

            print('Epoch: %03d/%03d | Batch %03d/%03d | Gen/Dis Loss: %.4f/%.4f'

                 %(epoch+1, num_epochs, batch_idx, len(train_loader), gener_loss, discr_loss))

    print('Time elapsed: %.2f min' % ((time.time() - start_time)/60))

print('Total Training Time: %.2f min' % ((time.time() - start_time)/60))

网络训练

画出 generator loss 和 discriminator loss 的变化图：

plt.plot(range(len(gener_costs)), gener_costs, label='generator loss')

plt.plot(range(len(discr_costs)), discr_costs, label='discriminator loss')

plt.legend()

plt.savefig('./loss.jpg')

plt.show()

利用以上训练的 Generator 生成一些仿手写数字图片：

#########################

## VISUALIZATION

#########################

model.eval()

# Make new images

z = torch.zeros((5, LATENT_DIM)).uniform_(-1.0, 1.0).to(device)

generated_features = model.generator_forward(z)

imgs = generated_features.view(-1, 28, 28)

fig, axes = plt.subplots(nrows=1, ncols=5, figsize=(20, 2.5))

for i, ax in enumerate(axes):

    axes[i].imshow(imgs[i].detach().numpy(), cmap='binary')

再生成几次：

可以发现，以上生成的数字图片有些很清晰，但有些很模糊，不易辨认，但是结果已经让人很兴奋了~~

后续可以对GAN进行改进，从而生成质量更高的图片。

Reference

　　[1] deeplearning-models——Github

　　[2] Paper《Generative Adversarial Network》　

GAN——生成手写数字的更多相关文章

GAN实战笔记——第三章第一个GAN模型：生成手写数字
第一个GAN模型-生成手写数字一.GAN的基础:对抗训练形式上,生成器和判别器由可微函数表示如神经网络,他们都有自己的代价函数.这两个网络是利用判别器的损失记性反向传播训练.判别器努力使真实样本输 ...
卷积生成对抗网络（DCGAN）---生成手写数字
深度卷积生成对抗网络(DCGAN) ---- 生成 MNIST 手写图片 1.基本原理生成对抗网络(GAN)由2个重要的部分构成: 生成器(Generator):通过机器生成数据(大部分情况下是图像 ...
Tensorflow:DCGAN生成手写数字
参考地址:https://blog.csdn.net/miracle_ma/article/details/78305991 使用DCGAN(deep convolutional GAN):深度卷积G ...
使用神经网络来识别手写数字【译】（三）- 用Python代码实现
实现我们分类数字的网络好,让我们使用随机梯度下降和 MNIST训练数据来写一个程序来学习怎样识别手写数字. 我们用Python (2.7) 来实现.只有 74 行代码!我们需要的第一个东西是 MNI ...
C#中调用Matlab人工神经网络算法实现手写数字识别
手写数字识别实现设计技术参数:通过由数字构成的图像,自动实现几个不同数字的识别,设计识别方法,有较高的识别率关键字:二值化投影矩阵目标定位 Matlab 手写数字图像识别简介: 手写 ...
基于opencv的手写数字识别（MFC,HOG,SVM）
参考了秋风细雨的文章:http://blog.csdn.net/candyforever/article/details/8564746 花了点时间编写出了程序,先看看效果吧. 识别效果大概都能正确. ...
【机器学习】BP神经网络实现手写数字识别
最近用python写了一个实现手写数字识别的BP神经网络,BP的推导到处都是,但是一动手才知道,会理论推导跟实现它是两回事.关于BP神经网络的实现网上有一些代码,可惜或多或少都有各种问题,在下手写了一 ...
深度学习-使用cuda加速卷积神经网络-手写数字识别准确率99.7%
源码和运行结果 cuda:https://github.com/zhxfl/CUDA-CNN C语言版本参考自:http://eric-yuan.me/ 针对著名手写数字识别的库mnist,准确率是9 ...
利用神经网络算法的C＃手写数字识别
欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 下载Demo - 2.77 MB (原始地址):handwritten_character_recognition.zip 下载源码 - 70. ...

随机推荐

4 CVE-2012-0158 漏洞分析
操作系统:Windows7 32位专业版 Office:2003sp3_20120218.exe 工具:OD和IDA 1.漏洞的本质:程序编写时未对内存拷贝函数的长度参数进行足够严谨的验证,造成的堆 ...
idea把菜单栏给点没了...(File、Edit、View、Navigate.......)
第一种方法找到idea的C盘的配置文件ui.lnf.xml文件第二种方法如果是高版本idea,我的是2019.3,双击shift选择Actions,搜索menu 然后重启idea
【洛谷P3756】[CQOI2017]老C的方块（最小割）
洛谷题意: 给出一个网格图类似于这样: 现在给出一个\(n*m\)大小的网格,之后会给出一些点,若某些点相连形成了如下的几个图案,那么就是不好的. 现在可以删去一些点,但删除每个点都有一些代价,问最 ...
c# 第9节数据类型之值类型
本节内容: 1:数据类型是什么 1:数据类型是什么 2:数据类型--值类型 3:值类型和引用类型的区分画图现象: 3:值类型的种类整数: 浮点数: 字符:
跟着ALEX 学python day2 基础2 模块数据类型运算符列表元组字典字符串的常用操作
声明 : 文档内容学习于 http://www.cnblogs.com/xiaozhiqi/ 模块初始: Python的强大之处在于他有非常丰富和强大的标准库和第三方库,几乎你想实现的任何功能都有相 ...
cisco
配置ntp conf t ntp server 172.28.10.10 clock timezone Beijing 8 show clock 配置端口组 interface Port-channe ...
JWT（Json Web Token）：一种在Web应用中安全传递信息的规范转载
文本将介绍一种在Web应用中安全传递信息的方式,称为JWT. 本文内容是对JWT官网介绍说明的英文翻译而来,由于本文英文水平有限,如有错误,还请指出,谢谢. What is JSON Web Toke ...
js toFixed() 四舍五入后并不是你期望的结果
小学的时候学数学就知道有一种叫四舍五入的计算方式,就是对于小数位数的取舍,逢五进一,比如1.225 取两位小数后就是1.23.在前端开发中自己也少不了这样的计算,js也提供了相关的方法--toFixe ...
SAP_B1系统对象说明 SBO SAP Business One
JS通过指定大小来压缩图片
安装: npm i image-conversion --save 引入: <script src="https://cdn.jsdelivr.net/gh/WangYuLue/ima ...

GAN——生成手写数字

GAN——生成手写数字的更多相关文章

随机推荐

热门专题