【每一个人都是梵高】A Neural Algorithm of Artistic Style

liguangsunls 2024-09-28 15:30:35 原文

文章地址：A Neural Algorithm of Artistic Style

代码：https://github.com/jcjohnson/neural-style

这篇文章我认为可以起个浪漫的名字——每一个人都是梵高。

主要做的一件事情非常有意思。就是例如以下图的等式，通过将a图的style和p图的content进行融合。得到第三幅图x。style+content=styled content

怎么做呢？首先他定义了两个loss。分别表示终于生成的图x和style图a的样式上的loss，以及x和content图p的内容上的loss。α,β是调节两者比例的參数。终于的loss function是两者的加和。

通过optimize总的loss求得终于的x。

Details

所用的CNN网络是VGG-16，利用了它16个卷积层和5个pooling层来生成feature。

如果某一层得到的响应是Fl∈RNl∗Ml,当中Nl为l层filter的个数，Ml为filter的大小。Flij表示的是第l层第i个filter在位置j的输出。

content loss

如果p和x在CNN中的响应分别为Pl和Fl。将他们内容上的loss表示成每一个pixel的二范数：

则用梯度下降法，content loss对F求导为：

Style Loss

图x的style表示为Gl∈RNl∗Nl,当中Glij=∑kFlik∗Fljk,即CNN同一层不同filter响应的互相关，至于为什么互相关可以表示style，well。I don’t know….

那么每一层style loss为

当中style图a的在CNN中的响应为A。

则总的style loss为每一层的加权和：

Total Loss

在定义好了两个loss的形式以后，又回到了最初的问题，就是最小化总的loss：

要注意的是。不同于一般的CNN优化，这里优化的參数不再是网络的w和b。而是初始输入的一张噪声图片x

终于我们想让他变成右图这样styled content。

Experiments

对同一张content图片运用不同style的结果例如以下图所看到的,fantastic!!
total loss中α和β的比例：

从上到下表示的是运用不同conv层的feature进行style，conv1->conv5是一个从总体到局部的过程；

从左到右表示的是不同的α/β的比例，10−5->10−2是指更注重style还是更强调content。

【每一个人都是梵高】A Neural Algorithm of Artistic Style的更多相关文章

【原创】梵高油画用深度卷积神经网络迭代十万次是什么效果？ A neural style of convolutional neural networks
作为一个脱离了低级趣味的码农,春节假期闲来无事,决定做一些有意思的事情打发时间,碰巧看到这篇论文: A neural style of convolutional neural networks,译作 ...
【原创】梵高油画用深度卷积神经网络迭代10万次是什么效果？ A neural style of convolutional neural networks
作为一个脱离了低级趣味的码农,春节假期闲来无事,决定做一些有意思的事情打发时间,碰巧看到这篇论文: A neural style of convolutional neural networks,译作 ...
同样级别iOS程序员，为啥比我菜的程序员薪资都比我高？
前言: 作为程序员,都有一种相同的焦虑——即当一次又一次的新技术浪潮袭来,总会不由自主的拼命跟随,总是担心如果不紧跟新技术的潮流,将会被时代所抛弃. 害怕年龄,害怕平庸,其实只是你在现实里的努力无法支 ...
人人都可以开发高可用高伸缩应用——论Azure Service Fabric的意义
今天推荐的文章其实是微软的一篇官方公告,宣布其即将发布的一个支撑高可用高伸缩云服务的框架--Azure Service Fabric. 前两天,微软Azure平台的CTO Mark Russinovi ...
深度学习入门实战（一）：像Prisma一样算法生成梵高风格画像
本文由云+社区发表作者:董超导语:现在人工智能是个大热点,而人工智能离不开机器学习,机器学习中深度学习又是比较热门的方向,本系列文章就从实战出发,介绍下如何使用MXnet进行深度学习~ 既然是实战 ...
box-sizing:border-box 将元素的内边距和边框都设定在宽高内计算
http://www.w3school.com.cn/cssref/pr_box-sizing.asp box-sizing: content-box|border-box|inherit; 值描述 ...
瞎谈CNN：通过优化求解输入图像
本文同步自我的知乎专栏: From Beijing with Love 机器学习和优化问题很多机器学习方法可以归结为优化问题,对于一个参数模型,比如神经网络,用来表示的话,训练模型其实就是下面的参数 ...
Image Style Transfer：多风格 TensorFlow 实现
·其实这是一个选修课的present,整理一下作为一篇博客,希望对你有用.讲解风格迁移的博客蛮多的,我就不过多的赘述了.讲一点几个关键的地方吧,当然最后的代码和ppt也希望对你有用. 1.引入: 风格 ...
[C4W4] Convolutional Neural Networks - Special applications: Face recognition & Neural style transfer
第四周:Special applications: Face recognition & Neural style transfer 什么是人脸识别?(What is face recogni ...

随机推荐

[Python爬虫] Selenium +phantomjs 模拟下拉滚动条
在爬虫中,有时会遇到这种情况,数据的展示是不是一页一页的,而是通过不断的下拉滚动条来加载数据.例如一点咨询(http://www.yidianzixun.com/)和微博(在未登录的状态下:http: ...
datagrid MAC和VPNIP显示不出来，Time显示错误的问题
之前出错时也没截图,大致说一下. 这是现在运行成功的界面: 开始时间界面出现的是时间是原始值,即1970年1月1日午夜以来的毫秒数,类似于这样:1523786314827 因为我这里是调用的函数读取m ...
转：关于Android机型适配这件小事儿
http://www.umindex.com/devices/android_resolutions 大家都知道Android机型分裂严重,在开发Android App的时候永远都面临适配N多机型的问 ...
.NET Framwork 之源代码编译成托管代码托管代码合并成程序集
我们都知道,C#程序需要在 .NET Framework 的环境中运行. 一.程序运行所需的三个关键 1.IL(中间语言):编译器编译源代码时生成的代码. 2. Framework类库(Framewo ...
python fabric使用 http://fabric-chs.readthedocs.io/zh_CN/chs/tutorial.html
fab -u username -p password -H hostname -P -- cmd 或root@'hostname' -H多个主机是引号用逗号隔开 -P异步
算法笔记_057:蓝桥杯练习最大的算式（Java）
目录 1 问题描述 2 解决方案 1 问题描述问题描述题目很简单,给出N个数字,不改变它们的相对位置,在中间加入K个乘号和N-K-1个加号,(括号随便加)使最终结果尽量大.因为乘号和加号一共就 ...
算法笔记_064:蓝桥杯练习操作格子（Java）
目录 1 问题描述 2 解决方案 1 问题描述问题描述有n个格子,从左到右放成一排,编号为1-n. 共有m次操作,有3种操作类型: 1.修改一个格子的权值, 2.求连续一段格子权值和, 3.求 ...
chromedriver Capabilities & ChromeOptions
Capabilities are options that you can use to customize and configure a ChromeDriver session. This pa ...
list_entry(ptr, type, member)——知道结构体内某一成员变量地址，求结构体地址
#define list_entry(ptr, type, member) \ ((type *)(() -> member))) 解释: 1 在0这个地址看做有一个虚拟的type类型的变量,那 ...
让你的 wowza server提供 RESTful web 服务
有时我们 nginx 须要和 wowza 服务器交互以进行一些 LB 事宜:有时我们的管理员须要实时了解 wowza 服务器的一些其它状态信息(比方一些自己定义对象的状态等等).而用 ...