CVPR 之 老照片修复
周末闲来无事,随手整理电脑里的照片,望着一张物是人非的老相片,勾起了斑驳的回忆。忽尔转念一想,何不 PS 下,但 PhotoShop 有些大且不免费自己懒得装,于是,转向免费的图像复原软件。
网上搜来找去,却一直没寻到合适的,最后查到 CVPR 2020 的一篇 Oral 论文,看到有的博客已经详细介绍过了,恰好作者也开放了源码,于是,一时兴起,拍脑门决定,就拿这个来复原老相片吧。
结果,忙活了半个晚上 (主要是用手机热点,时间浪费在了下载速度上) 加一个上午 (踩了很多第三方库安装、python 向低版本重装的坑),终于成功复原图像,遂写下此博文,以免后来者重复踩坑 ... ...
1 CVPR 会议
CVPR 全称 IEEE Conference on Computer Vsion and Pattern Recongniton,是计算机视觉的三大顶会之一 (另两个是 ICCV 和 ECCV),由 IEEE 每年举办一次
2021年,按照 Google Scholar Metrics 排名,CVPR 已经挤掉了《柳叶刀》,成为全球影响力排名第四的顶级期刊会议,排在前面的有 《Nature》和《Science》
2 Oral 论文
2020年的 CVPR 会议中,有效投稿 6656 篇论文,1470 篇被录用,接收率约 22%,其中 335 篇选中 Oral,比率约 5%
这篇《Bringing Old Photos Back to Life》属于 Oral 论文,含金量可见一斑,论文链接:https://arxiv.org/pdf/2004.09484.pdf
论文里面的内容不再赘述,请读者自行阅读,摘录论文实现的效果图,如下:
实现源码作者已经开放,GitHub 链接:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life
3 实践步骤
3.1 测试环境
Win 64 中使用 PoweShell 终端,已安装 Python 3.9.9,安装过程中勾选下图 pip 选项:
可在 PowerShell 中输入 py --version,查看安装的 Python 版本
3.2 源码和模型
3.2.1 源码
如有 git 可用 git clone 命令,如下
git clone https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life.git
也可直接下载链接中的 Source code:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life/releases
如果下载速度较慢的话,可先点击下载,然后复制链接到迅雷下载,能显著提高下载速度
3.2.2 模型
1) 下载 face_landmark 预训练模型,解压后放在 Face_Detection 目录下
cd Face_Detection/
wget http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
bzip2 -d shape_predictor_68_face_landmarks.dat.bz2
cd ../
2) 下载 face_checkpoints 模型,解压后置于 Face_Enhancement 目录下
cd Face_Enhancement/
wget https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life/releases/download/v1.0/face_checkpoints.zip
unzip face_checkpoints.zip
cd ../
3) 下载 global_checkpoints 模型,解压后置于 Global 目录下
cd Global/
wget https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life/releases/download/v1.0/global_checkpoints.zip
unzip global_checkpoints.zip
cd ../
2) 和 3) 也可以通过 3.2.1 中的链接下载,解压后分别置于对应目录中
3.2.3 sync_batchnorm
下载 Synchronized-BatchNorm-PyTorch,将子文件夹 sync_batchnorm,拷贝到 Face_Enhancement/models/networks/ 目录下
cd Face_Enhancement/models/networks/
git clone https://github.com/vacancy/Synchronized-BatchNorm-PyTorch
cp -rf Synchronized-BatchNorm-PyTorch/sync_batchnorm .
cd ../../../
相同的 sync_batchnorm 文件夹,再拷贝到 Global/detection_models/ 目录下
cd Global/detection_models
git clone https://github.com/vacancy/Synchronized-BatchNorm-PyTorch # no need doing git clone once again
cp -rf Synchronized-BatchNorm-PyTorch/sync_batchnorm .
cd ../../
3.3 依赖库
3.3.1 第三方库
可直接使用 pip 和 requirements.txt,一键下载全部依赖库
pip install -r requirements.txt
requirements.txt 中的所有依赖库如下:其中,torch, torchvision 和 dlib 稍稍复杂,可放在后面单独安装
torch
torchvision
dlib
scikit-image
easydict
PyYAML
dominate>=2.3.1
dill
tensorboardX
scipy
opencv-python
einops
PySimpleGUI
3.3.2 Torch 和 Torchvision
Torch, Torchvision 和 Python,三者版本是有一定的对应关系,需要单独安装,关系图参考:https://github.com/pytorch/vision
第一种方法,用 pip install torch==1.8.1 和 pip install torchvision==0.9.2 进行安装,但在 PowerShell 中,有时会因网络不稳定导致安装不成功
第二种方法,提前下载好对应的 .whl 版本,下载链接:https://download.pytorch.org/whl/torch_stable.html,然后,分别执行如下命令
pip install torch-1.8.1+cpu-cp39-cp39-win_amd64.whl
pip install torchvision-0.9.1+cpu-cp39-cp39-win_amd64.whl
安装成功后,可用如下命令查看版本
import torch
print(torch.__version__)
查看的版本是 torch 1.8.1+cpu 和 torchvision 0.9.1+cpu
3.3.3 dlib
直接使用 pip install dib,安装并不成功,建议先下载 .whl 文件,再通过 pip 来安装,下载链接:https://github.com/sachadee/Dlib
pip install dlib-19.22.99-cp39-cp39-win_amd64.whl
3.4 执行效果
此处使用普通电脑测试,没有 GPU,所以 "--GPU" 设为 “-1”
1) 对于带有划痕的照片,加选项 “--with_scratch”
2) 对于高分辨率的照片,加选项 "--HR"
py run.py --input_folder ./test_images/old/ --output_folder ./output/ --GPU -1
翻拍的老相片,复原前后对比如下:尤其放大相片后,人脸的对比效果非常明显
4 其它方法
阅读一篇好的论文,显然比在网上搜索更加有效,从文末的效果对比可知,主流的图像复原方法有:DIP, CyleGAN, Sequential, Pix2Pix 和 Operation-wise Attention 等
参考资料
Bringing Old Photos Back to Life
照片修复-使用Bringing-Old-Photos-Back-to-Life
CVPR 之 老照片修复的更多相关文章
- PS高级特训班 百度云资源(价值2180元)
课程目录: 第1章第一期1第一节 火焰拳头1:12:252第二节 荷叶合成00:05:143第三节 新年巨惠海报(一)1:00:374第四节 新年巨惠海报(二)1:05:345第五节 美食印刷品1 ...
- 女性对DeepNude脱衣技术的防护
写在前面的话 本文不提供下载方式,开源部分只是社区逆向后公开的部分源码 这篇文章有些人看了可能会比较极端,但不从技术角度分析又谈何防护?攻与防一直存在,不管是安全还是AI都是一样 你极端不极端,它就在 ...
- 教你用PS修复老照片
原图素材虽然很旧,不过人物部分并没有怎么损坏,只是有一些色块和杂色.修复的工程相对来说也少很多.只需要给人物磨好皮,然后把暗调和高光部分调出来即可.原图 一.打开原图素材,按Ctrl + J ...
- CVPR论文《100+ Times Faster Weighted Median Filter (WMF)》的实现和解析(附源代码)。
四年前第一次看到<100+ Times FasterWeighted Median Filter (WMF)>一文时,因为他附带了源代码,而且还是CVPR论文,因此,当时也对代码进行了一定 ...
- 从CVPR 2014看计算机视觉领域的最新热点
编者按:2014年度计算机视觉方向的顶级会议CVPR上月落下帷幕.在这次大会中,微软亚洲研究院共有15篇论文入选.今年的CVPR上有哪些让人眼前一亮的研究,又反映出哪些趋势?来听赴美参加会议的微软亚洲 ...
- 从CVPR 2014看计算机视觉领域的最新热点
2014看计算机视觉领域的最新热点" title="从CVPR 2014看计算机视觉领域的最新热点"> 编者按:2014年度计算机视觉方向的顶级会议CVPR上月落下 ...
- 在开启DRS的集群中修复VMware虚拟主机启动问题
通过iSCSI方式连接到ESXi主机上的外挂存储意外失联了一段时间,导致部分虚拟主机在集群中呈现出孤立的状态,单独登陆到每台ESXi上可以看到这些虚拟主机都变成了unknow状态.因为有过上一次(VM ...
- 热修复-Tinker
微信开源,真是喜出望外,必须要去看看啊,比起nuwa来微信好很多,而且github上也有专门的官方文档说明,还有很多资料查询 参考地址:https://github.com/Tencent/tinke ...
- 热修复-Nuwa学习篇
nuwa热修复是基于qq空间团队的思路,最近的热度话题了,很多种方案,自己先研究几种方案,基本上都各有优势,学习肯定得先挑个软柿子捏了,自己对比了一下,发现nuwa代码量少点,所以就决定了,先研究nu ...
随机推荐
- 关于VS中的无法解析的外部符号问题
利用caffe的源码编译出的caffe.lib静态链接库里面就包含了源码里面的那些函数的接口i,所以如果在程序中使用的是源码的话,就不需要在链接器里面再添加此静态链接库了 对于无法解析的外部符号,首先 ...
- 透过 Chrome 深入理解浏览器导航过程
网络的导航,是从输入 url 到最终获取到文件的过程.其中牵扯到浏览器架构.操作系统.网络等一系列知识.本文将从各个角度详细论述这一过程,涉及广度与深度.如果您是已经有一定基础的同学,那么本文可以快速 ...
- C++核心编程 1 程序的内存模型
1.内存分区模型 C++程序在执行时,将内存大方向划分为4个区域 代码区:存放函数体的二进制代码,由操作系统进行管理(写的所有代码都在代码区) 全局区:存放全局变量.静态变量以及常量 栈 区:由编 ...
- 开发函数计算的正确姿势——OCR 服务
作者 | 杜万(倚贤) 阿里云技术专家 简介 首先介绍下在本文出现的几个比较重要的概念: OCR(光学字符识别):光学字符识别(Optical Character Recognition, OCR)是 ...
- System.Drawing Linux Centos7 The type initializer for 'Gdip' threw an exception
System.Drawing 在linux使用时提示异常 The type initializer for 'Gdip' threw an exception 解决方案: yum install au ...
- CF123E Maze(期望dp,树形dp,式子)
题目大意: 给你一棵树,边权都是1,每一个点有一个是起点的概率和一个是终点的概率,你将以起点为根,开始在树上随机dfs,每到一个点,就会将他的所有儿子随机打乱成序列,然后按照那个随机顺序走完,直到走到 ...
- bzoj2460元素(线性基,贪心)
题目大意: 给定\(n\)个二元组\((a,b)\),求一个最大的\(\sum b\)的集合,满足这个集合的任意子集的\(a\)的\(xor\)值不为0 这道题需要一个线性基的性质: 线性基的任何非空 ...
- 用最简单的方式理解 IoC 控制反转
思想引入 假设一个系统原先只设定有一个默认的方法去完成业务,这里举例这个原先设定开发的是 UserDaoImpl(可能有些牵强,但是不影响我们对逻辑的理解)这样一个业务. 后来有一天,需求变了,业务流 ...
- SpringMVC 获得请求数据
获得请求参数 客户端请求参数的格式是:name=value&name=value- - 服务器端要获得请求的参数,有时还需要进行数据的封装,SpringMVC可以接收如下类型的参数: 基本类型 ...
- Map中getOrDefault()与数值进行比较
一般用哈希表计数时,value类型通常为Integer.如果想比较某个key出现的次数,使用get(key)与某个数值进行比较是有问题的.当哈希表中并不包含该key时,因为此时get方法返回值是nul ...