电影AI修复,让重温经典有了新的可能
摘要:有没有一种呈现,不以追求商业为第一目的,不用花大价钱,不用翻拍,没有画蛇添足,低成本的可共赏的让经典更清晰?
本文分享自华为云社区《除了重映和翻拍,重温经典的第三种可能》,原文作者:音视频大管家。
时隔12年,《阿凡达》重映了,国内重映票房累计预估14.8 亿元人民币!!!
经典就是经典!
说到经典重映,没有奥斯卡最佳摄影、最佳视觉效果、最佳艺术指导三大奖项加持,很难有哪部电影,能有《阿凡达》这样重映的底气吧。包括《泰坦尼克号》、国内星爷的《功夫》等,更多是花大价钱做修复,甚至还原成3D版,客观说市场效果一般。
为了经典再现,翻拍也是一个方式,如《大话西游III》、《倩女幽魂》、《白蛇传说》,结果观众并不买单。毕竟成为经典除了剧情和导演,还有演员以及时代的特征等因素的共同作用,所以翻拍一不小心就失去了原有的味道。
有没有一种呈现,不以追求商业为第一目的,不用花大价钱,不用翻拍,没有画蛇添足,低成本的可共赏的让经典更清晰?
有!因为人们对经典影片再次精彩呈现的追求,从未止步。为了让经典重新焕发光芒,华为云视频云开启了香港经典电影的高清修复之路。
这个周末,重温80后的青春记忆就在华为视频APP。
一、电影修复要做什么
先做一个范畴设定:我们今天聊的是电影AI修复的问题。所以高成本多人力投入类似《泰坦尼克号》的修复不在此范畴。
电影修复最直观的是让图像更清晰。第一步需要了解图像不清晰的原因是什么。我们直观理解是:时间太久了。
从专业的角度来说,电影的修复,除了视频修复外,还需要做视频增强的处理,这样才能达到更好的效果。
1.视频修复
视频修复要解决的问题是:视频在拍摄、压缩、传输、存储等环节由于各种原因导致的视频画质问题。这些画质问题展开来说包括:划痕、压缩失真、噪点等。为了帮助大家更直观了解这些问题对画面的影响,我们找来了某些方面的问题比较突出的图片。
保存或搬运受损导致的划痕
压缩带来的失真
拍摄设备局限产生的噪点
当然,以上图片并非只有一个问题。同样,在电影修复的真实场景中,往往包含多种失真,且失真程度差异大。修复起来就得综合考虑。
2.视频增强
视频增强主要增强哪些部分?肉眼如何辨别增强效果?
视频增强的效果一般从四个方面来体现:分辨率、帧率、动态范围、色域。
- 高分辨率
分辨率在这里指显示器所能显示的像素有多少。显示器可显示的像素越多,画面就越精细。很明显,4K能显示的比720P显示的就清晰很多。视频增强可以提升分辨率。
- 高帧率
我们都知道,视频是由一帧帧图片组合而成。可以将左边的视频理解为1秒钟有24帧图片,右边1秒钟有60帧图片,很明显,右边的视频看上去更加流畅顺滑。
- 高动态范围
高动态范围简称HDR,标准动态范围简称SDR。通俗讲,在SDR的基础上,HDR能做到让画面亮的地方更亮,暗的地方更暗;色彩的范围可以由BT709增加到BT2020;并且色彩的变化也会更加平滑。
- 广色域
广色域,可以理解为单独对颜色的范围进行调整,由原来的709BT提升到2020BT。
总之,视频增强主要是在以上四个方面增强效果,解决的是因显示硬件升级,使得先前采集、制作的视频无法最优匹配的问题。
二、电影修复的三大挑战
目前要自动修复老电影,并非易事,面临着三大挑战:数据、算法、评价。
1.数据挑战:盲修复任务的泛化能力提升
电影的失真往往包含了上述多个问题,也就是混合失真。盲修复,就是在修复之前,并不清楚视频中有哪些问题,用的是泛化的算法,面临难题是:如何提升泛化算法的自适应性来应对多种修复场景;如何利用少量对比的数据,提升学习效果。
混合失真
强度不一失真
2.算法挑战:如何同时让图像各个方面质量得到提升
与失真的情况一样,视频增强在实际应用中,往往是多任务组合,如将1080p 30fps SDR提升为4K 60fps HDR视频。即同时需要将图像分辨率由1080变成4000,将每秒的帧数由30提升到60,将标准动态范围转为高动态范围。说人话就是让视频的图像像素更高、光线更清晰、色彩更饱满、颜色过度更顺滑、运动画面显示更流畅。这就要求多任务之间的优化需要联合增强。
3.评价挑战:针对生成图像的质量评价
传统的评价算法主要有PSNR,SSIM,VMAF,然而表现并不好。基于深度学习的修复增强算法,输出信号特征与原图差异巨大。举个例子:图片Reference经过一定处理以后,如果用传统的评价算法,得出的是Patch0,而我们主观评价是Patch1. 说明传统评价算法与主观评价算法不太一致,这就需要新的评价算法。
三、华为云视频云如何修复电影
先来直观感受一下华为云视频云修复电影前后的对比,点击查看《黄飞鸿》修复片段
1.电影修复技术架构
为了使修复做到轻量化、低成本以及自适应,华为云视频云构建了一整套电影修复技术架构。该架构包括质量检测、算法调度以及主客观评价三个环节,具体如下:
2.具体操作
- 混合失真修复
华为云视频云在处理失真问题时,将传统强度检测作为先验输入,即对可能存在的失真问题,先预判,然后输入AI算法中,再构建多任务混合失真修复模型,最后进行修复。
- 空域增强:基于语义特征的视频超分
超分就是指通过媒体处理技术将分辨率低的图片变为分辨率更高的图片。超分实现的原理是:先利用了大量的高分辨率图像积累并进行学习,再对低分辨率的图像进行学习高分辨率图像的学习模型引入来进行恢复,最后得到图像的高频细节,获得更好的图像恢复效果,提高图像的识别能力和识别精度。
对大部分电影、电视剧,受众往往更关注人脸及字幕,所以这两者是重要的增强区域,且具有较强先验。华为云视频云从网络轻量化、稳定性、综合效果等角度出发,实现了一种基于语义的自适应超分算法。对比可参考下图:
- 时域增强:插帧
空域与时域是一个相对概念,如果把空域理解为影片当中的某一个画面,那么时域更关注的是画面之间的衔接关系。如果空域增强是对每个画面的增强,那么时域增强在视觉感知上,往往指影片画面与画面之间的衔接更顺滑与流畅。所以在视频增强过程中,插帧是强依赖于运动估计。这个估计准确度又会受遮挡、小物体大运动、重复纹理、运动模糊等场景的影响。
华为云视频云通过改进网络,结合传统方法,如参考时空域上相邻的运动向量对光流进行修正,如下:
- 对比度与饱和度增强
现有基于深度学习的对比度和饱和度增强算法,由于数据的不足,难以达到好的效果。华为云视频云通过寻找图像在亮度和色彩空间的统计规律,作为网络先验输入,能较好解决数据问题。
说了这么多,你一定想问,在哪里可以看到啊?
小编不卖关子了,请移步华为视频-电影-高清修复,欢迎对比提建议。
这个周末,让我们一起重温星爷的老电影,还有那些曾经的经典之作。
同样的片段,现在的你和曾经的你,心境是否一样?
电影AI修复,让重温经典有了新的可能的更多相关文章
- 2020无损车载音源抖音歌曲下栽经典流行MP3新歌曲视频音乐下载包
2020无损车载音源抖音歌曲下栽经典流行MP3新歌曲视频音乐下载包 偶有几次乘出租车晚归,除了发现出租车司机都很爱听叶文有话要说之外,也发现有的出租车司机还是很有听歌品位的,车载音响系统改的也很棒.有 ...
- 重温经典之赫夫曼(Huffman)编码
先看看赫夫曼树假设有n个权值{w1,w2,…,wn},构造一个有n个叶子结点的二叉树,每个叶子结点权值为wi,则其中带权路径长度WPL最小的二叉树称作赫夫曼树或最优二叉树. 赫夫曼树的构造,赫夫曼最早 ...
- AI零基础入门之人工智能开启新时代—上篇
人工智能的发展史及应用 开篇:人工智能无处不在 人工智能的发展历程 · 1945艾伦图灵在论文<计算机器不智能>中提出了著名的图灵测试,给人工智能的収展产生了深远的影响. · 1951年, ...
- AI零基础入门之人工智能开启新时代—下篇
人工智能概述 人工智能的定义 · 人工智能是通过机器来模拟人类认识能力的一种科技能力 · 人工智能最核心的能力就是根据给定的输入做出判断或预测 · 思考:通过什么途径才能让机器具备这样的能力? · 举 ...
- AndroidP推出多项AI功能,会不会引发新的隐私担忧?
让谷歌很"伤心"的是,相比苹果iOS系统的统一,Android系统的碎片化态势实在太严重了.就像已经发布一年多的Android O,其占有率仅有4.6%.主要是因为很多手机厂商都会 ...
- 打造Orm经典,创CRUD新时代,Orm的反攻战
让我们开启数据库无Linq.零sql时代(续) 第一部分 MQL qq群:225656797 demo下载: 点此下载(既然下载,就支持该文,关注我的博客) Moon.Orm 5.0 (MQL版) 版 ...
- 2.69分钟完成BERT训练!新发CANN 5.0加持
摘要:快,着实有点快. 现在,经典模型BERT只需2.69分钟.ResNet只需16秒. 啪的一下,就能完成训练! 本文分享自华为云社区<这就是华为速度:2.69分钟完成BERT训练!新发CAN ...
- 重温CSS3
基础不牢,地动山摇!没办法,只能重温"经典"! 1.CSS3边框:border-radius; box-shadow; border-image border-radius:r1, ...
- 经典论文翻译导读之《Google File System》(转)
[译者预读] GFS这三个字母无需过多修饰,<Google File System>的论文也早有译版.但是这不妨碍我们加点批注.重温经典,并结合上篇Haystack的文章,将GFS.TFS ...
随机推荐
- C# 类(9) - 接口 Interface
Interface 接口 类似 抽象类,也不能被实例化...(前面说的静态类,加上抽象类,还有这个,都3个了)接口其实比 抽象类 更加抽象.接口的方法(这个方法还不能有实体代码,和抽象类的抽象方法差不 ...
- 洛谷p1637 三元上升子序列(树状数组
题目描述 Erwin最近对一种叫"thair"的东西巨感兴趣... 在含有n个整数的序列a1,a2......an中, 三个数被称作"thair"当且仅当i&l ...
- ubuntu+将主机编译的库链接到虚拟环境Python中
这里且以opencv为例: cd ~/.virtualenvs/YOUR_ENV/lib/python3.5/site-packages/ ln -s /usr/local/lib/python3.5 ...
- CN_Week2_Neuron_code
CN_Week1_Neuron_code on Coursera Abstract for week2: -- 1. Technique for recording from the brain. - ...
- WebAssembly in Action
WebAssembly in Action 数据加密,反爬虫,防盗链,版权保护,数据追踪,埋点 blogs 加密,js 禁用检测,权限控制 WebAssembly 防盗链 wasm online id ...
- js generator和yield
function co<T>(fn: () => Generator<any, any, any>): Promise<T> { const g: Gener ...
- java数据类型(基础篇)
public class note02 { public static void main(String[] args) { //八大基本数据类型 //1.整数 byte num1 = 1; shor ...
- JVM性能调优经验总结
本文转载自JVM性能调优经验总结 说明 调优是一个循序渐进的过程,必然需要经历多次迭代,最终才能换取一个较好的折中方案. 在JVM调优这个领域,没有任何一种调优方案是适用于所有应用场景的,同时,切勿极 ...
- (十一) 数据库查询处理之连接(Join)
(十一) 数据库查询处理之连接(Join) 1. 连接操作的一个例子 把外层关系和内层关系中满足一定关系的属性值拼接成一个新的元组 一种现在仍然十分有用的优化思路Late Materializatio ...
- OAuth2理解
OAuth2: 1.他是针对特定问题的一种解决方案 OAuth2主要可以解决两个问题: (1)开放系统间的授权问题 例如:当你想要一个打印机器去打印自己百度网盘中的照片时,该机器并没有访问自己百度网盘 ...