A Neural Algorithm of Artistic Style 图像风格转换

前言

深度学习是最近比较热的词语。说到深度学习的应用，第一个想到的就是Prisma App的图像风格转换。既然感兴趣就直接开始干，读了论文，一知半解；看了别人的源码，才算大概了解的具体的实现，也惊叹别人的奇思妙想。

声明

代码主要学习了【titu1994/Neural-Style-Transfer】的代码，算是该项目部分的简化版或者删减版。这里做代码的注解和解释，也作为一个小玩具。
论文可以参考【A Neural Algorithm of Artistic Style】，网上也有中文的版本。
使用的工具：py34、keras1.1.2、theano0.8.2、GeForce GT 740M (CNMeM is disabled, cuDNN not available)。

实现原理

1. 总流程

实现流程如下，可以看到这里总共分为5层，本次实验使用vgg16模型实现的。
如上，a有个别名是conv1_1，b是conv2_1，依次类推，c，d，e对应conv3_1，conv4_1，conv5_1；输入图片有风格图片style image和内容图片content image，输出的是就是合成图片，然后用合成图片为指导训练，但是训练的对象不像是普通的神经网络那样训练权值w和偏置项b，而是训练合成图片上的像素点，以达到损失函数不断减少的效果。论文使用的是随机的噪声像素图为初始合成图，但是使用原始图片会快一点。

2. 内容损失函数 - Content Loss

下面是content loss函数的定义。
l代表第l层的特征表示，p是原始图片，x是生成图片。公式的含义就是对于每一层，原始图片生成特征图和生成图片的特征图的一一对应做平方差。

3. 风格损失函数 - style loss

在定义风格损失函数之前首先定义一个Gram矩阵。
F是生成图片的特征图。上面式子的含义：Gram第i行，第j列的数值等于把生成图在第l层的第i个特征图与第j个特征图分别拉成一维后相乘求和。

上面是风格损失函数，Nl是指生成图的特征图数量，Ml是图片宽乘高。a是指风格图片，x是指生成图片。G是生成图的Gram矩阵，A是风格图的Gram矩阵，wl是权重。

4. 总损失

总损失函数如下，alpha与beta比例为1*10^-3或更小。

代码讲解

1. 图片预处理和还原

def preprocess_image(image_path):

    img = imread(image_path)

	// GPU显存有限，这里使用400*400大小的图片

    img = imresize(img, (400, 400)).astype('float32')

	// 这里要对RGB通道做预处理

	// 这里貌似是RGB的平均值，具体不清楚

    img = img[:, :, ::-1]

    img[:, :, 0] -= 103.939

    img[:, :, 1] -= 116.779

    img[:, :, 2] -= 123.68

    img = img.transpose((2, 0, 1)).astype("float32")

    img = np.expand_dims(img, axis=0)

    return img

def deprocess_image(x):

    x = x.reshape((3, 400, 400))

    x = x.transpose((1, 2, 0))

    x[:, :, 0] += 103.939

    x[:, :, 1] += 116.779

    x[:, :, 2] += 123.68

    x = x[:, :, ::-1]

    x = np.clip(x, 0, 255).astype('uint8')

    return x

2. content loss

def content_loss(base, combination):

    channel_dim = 0 if K.image_dim_ordering() == "th" else -1

    channels = K.shape(base)[channel_dim]

    size = 400 * 400

    multiplier = 1 / (2. * channels ** 0.5 * size ** 0.5)

    return multiplier * K.sum(K.square(combination - base))

3. style loss

def gram_matrix(x):

    assert K.ndim(x) == 3

    features = K.batch_flatten(x)

    gram = K.dot(features, K.transpose(features))

    return gram

def style_loss(style, combination):

    assert K.ndim(style) == 3

    assert K.ndim(combination) == 3

    S = gram_matrix(style)

    C = gram_matrix(combination)

    channels = 3

    size = 400 * 400

    return K.sum(K.square(S - C)) / (4. * (channels ** 2) * (size ** 2))

结果

输入：

输出：

分析

可以看出效果每一代都有进步，因为自己的显卡渣，跑一代估计要1.5个小时，自己测试的时候总共跑了14个小时，不过这里有个技巧，就是可以把上一代的图片继续做输入，这样中途有什么事就可以停止。下次只要把上次输出的图片当输入就可以。
因为是个小玩具，所以图片的切割都是用ps切出来的。其他的什么mask都没有实现。
vgg16模型加载原项目的权值。
具体项目代码可见【自己的github项目】上的代码、权值文件和测试图片，因为中途修改过，可能有些地方需要改过来，不过代码比较简单，估计很快就可以找到问题了。

A Neural Algorithm of Artistic Style 图像风格转换 - keras简化版实现的更多相关文章

A Neural Algorithm of Artistic Style
本系列文章由 @yhl_leo 出品,转载请注明出处. 文章链接: http://blog.csdn.net/yhl_leo/article/details/53931536 1. 资源 Paper: ...
【每一个人都是梵高】A Neural Algorithm of Artistic Style
文章地址:A Neural Algorithm of Artistic Style 代码:https://github.com/jcjohnson/neural-style 这篇文章我认为可以起个浪漫 ...
《A Neural Algorithm of Artistic Style》理解
在美术中,特别是绘画,人类掌握了通过在图像的内容和风格间建立复杂的相互作用从而创造独特的视觉体验的技巧.到目前为止,这个过程的算法基础是未知的,也没有现存的人工系统拥有这样的能力.然而在视觉感知的其他 ...
Ubuntu16.04+GTX1080配置TensorFlow并实现图像风格转换
1. TensorFlow TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,表达了高层次的机器学习计算,大幅简化了第一代系统,并且具备更好的灵活性和可延展性. Te ...
python用直方图规定化实现图像风格转换
以下内容需要直方图均衡化.规定化知识均衡化:https://blog.csdn.net/macunshi/article/details/79815870 规定化:https://blog.csdn ...
【神经网络与深度学习】neural-style、chainer-fast-neuralstyle图像风格转换使用
neural-style 官方地址:这个是使用torch7实现的;torch7安装比较麻烦.我这里使用的是大神使用TensorFlow实现的https://github.com/anishathaly ...
基于 Keras 实现图像风格转移
Style Transfer 这个方向火起来是从2015年Gatys发表的Paper A Neural Algorithm of Artistic Style(神经风格迁移) , 这里就简单提一下论 ...
deeplearning.ai 卷积神经网络 Week 4 特殊应用：人脸识别和神经风格转换听课笔记
本周课程的主题是两大应用:人脸检测和风格迁移. 1. Face verification vs. face recognition Verification: 一对一的问题. 1) 输入:image, ...
神经风格转换 (Neural-Style-Transfer-Papers)
原文:https://github.com/ycjing/Neural-Style-Transfer-Papers Neural-Style-Transfer-Papers Selected pape ...

随机推荐

【Python】 xml转json
虽然python有解析xml的模块,也有生成json的模块,但是没有把这两者连接起来的模块. 下面是以来自MIT的大神Martin Blech写的一个方便的模块,供大家参考.也别忘了在用之前先拜谢作者 ...
Java NIO系列教程（六）多路复用器Selector
多路复用器Selector是Java NIO编程的基础,熟练地掌握Selector对于掌握NIO编程至关重要.多路复用器提供选择已经就绪的任务的能力.简单来讲,Selector会不断地轮询注册在其上的 ...
JWT 简介
JWT是一种用于双方之间传递安全信息的简洁的.URL安全的表述性声明规范.JWT作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以Json对象的形式安全的传递信息 ...
canvas填充样式
填充样式主要针对fillStyle.fillStyle除了可以赋值为color,还可以赋值渐变色,包括线性渐变色和径向渐变色,还是和css3里的内容类似. 一.线性渐变 1.设置线性渐变的填充样式设 ...
巨人大哥谈Web应用中的Session(session详解)
巨人大哥谈Web应用中的Session(session详解) 虽然session机制在web应用程序中被采用已经很长时间了,但是仍然有很多人不清楚session机制的本质,以至不能正确的应用这一技术. ...
node初始
### 一.什么是node.js > Node是一个基于 Chrome V8 引擎的 JavaScript 运行环境 > > Node使用了一个事件驱动.非阻塞式 I/O 的模型,使 ...
iPhone的App嵌入html页面问题
测试环境:iPhone ios 11.0.3 问题:iPhone App嵌入HTML页面,页面拉动到底部时,手势从屏幕底部边缘开始往上拉动,页面出现白色图层,且html页面一屏外的会卡住,无法滚动,需 ...
高级软件工程2017第7次作业--团队项目：Beta阶段综合报告
Deadline:2017-11-06(周一) 21:00pm (注:以下内容参考集大作业8 集大作业9 集大作业10 ) 0.评分规则: 按时交 - 有分,内容包括以下5个方面: Beta阶段敏捷冲 ...
团队作业4——第一次项目冲刺（Alpha版本） Day 2
小队@JMUZJB-集美震惊部一.Daily Scrum Meeting照片二.Burndown Chart 燃尽图三.项目进展成员工作丘雨晨环境配置刘向东数据库搭建,环境配置江泽 ...
小黄衫 Get
小黄衫 Get . 十分荣幸在前四次作业中以微弱的3分之差拿到了第一,获得了本次的小黄衫. 先发点牢骚.. 讲道理,原本以为的研究生生涯应该就是埋在论文堆里度过的时候顺便上上课.当初选课的时候,学 ...

A Neural Algorithm of Artistic Style 图像风格转换 - keras简化版实现

前言

声明

实现原理

1. 总流程

2. 内容损失函数 - Content Loss

3. 风格损失函数 - style loss

4. 总损失

代码讲解

1. 图片预处理和还原

2. content loss

3. style loss

结果

分析

A Neural Algorithm of Artistic Style 图像风格转换 - keras简化版实现的更多相关文章

随机推荐

热门专题