前言

2017年底时候写了这篇《集 降噪 美颜 虚化 增强 为一体的极速图像润色算法 附Demo程序

这也算是学习过程中比较有成就感的一个算法。

自2015年做算法开始到今天,还有个把月,就满五年了。

岁月匆匆,人生能有多少个五年。

这五年里,从音频图像到视频,从传统算法到深度学习,从2D到3D各种算法几乎都走了一个遍。

好在,不论在哪个领域都能有些许建树,这是博主我自身很欣慰的事情。

虽然有所间断但是仍然坚持写博客,并且坚持完整开源分享。

目的就是为了帮助那些一开始跟我一样,想要学习算法的萌新,

一起踏入算法领域去跟大家“排排坐,吃果果”。

引子

在这个特别的时间点,就想做点特别的事情。

那就是开源当时写的这个“美颜算法”,开源代码和当时的版本有些许出入,但是思路是一样的。

早些年的时候大家发现采用保边滤波的思路可以做到降噪,进而衍生出来针对皮肤的降噪,简称磨皮或者美颜。

从此百家争鸣,而这个课题到今天也还在发展,当然日新月异了。

故此,想谈谈针对美颜磨皮的一些算法思路,为后续想学习并改进的萌新提供一些养分。

概述美颜磨皮方法

1.基于保边降噪

这类算法有很多方法,但不外乎2种基础思路,

基于空间和基于频率,当然再展开的话,还可以细分为纹理和颜色。

例如通过肤色或纹理区域做针对性的处理。

这类算法的优点是计算简单,通用型强,但缺点就是不够细腻完美。

2.基于人脸检测贴图

这种严格意义上来说,是易容术,就是基于人脸检测出的关键数据。

例如人脸关键点,将人脸皮肤区域提取出来,重新贴上一张事先准备的皮肤图,进行皮肤贴合融合。

脸已经被置换了,效果很赞。有点缪修斯之船的味道。

这类算法优点是效果极其惊艳,但是算法复杂通用性差,一般只能针对少数角度表情的人脸。

3.结合1和2的深度学习方法

前两者的思路早期大行其道,如今到了数据时代,

基于深度学习的工具方案,可以非常好地结合前两者的思路,进行训练,求一个数据解。

很多人将深度学习等同于AI,这个做法有点激进。

基于深度学习的做法,仍然存在前两者一样的问题,简单的不够细腻,细腻的不够简单,

而如果要设计一个优秀的模型,其实跟设计一个传统算法一样困难。

基于数据驱动的算法,验证成本非常高,可控性比较差,当然在金钱的驱动下确实能产出还不错的算法模型。

这类算法的优点,往往能求出很不错的局部最优解,甚至以假乱真,缺点就是需要大量金钱和数据的驱动。

总结来说的话,不付出代价,就别想有好的结果,非常的现实。

据我所知目前使用最多的方案是第一种和第三种,第二种可操作性不强,只有少数公司掌握了这方面的核心技术。

但是不管是哪种方案,无非就是以下几个步骤。

1.确定人脸的皮肤区域

2.定位人脸的杂质(痘痘,斑点,痣,肤色不均等)

3.根据定位到杂质进行填补修复或滤除

这就是图像处理经典三部曲

1.定位 2.检测 3.处理

每一个细分展开,都非常宏大且复杂的算法。

以上,仅以磨皮美颜为例子,阐述图像方面的算法想要或正在解决什么样的问题。

我们在工作中碰到的图像问题无非以上几个核心问题,问题都是类似的,只是不同场景和需求下各有难处。

本次开源的算法思路

本次开源的算法是基于保边降噪的思路,

当然这个思路可以通过改写,参数化后可以集成到深度学习中,作为一个先验层辅助训练。

算法步骤如下:

1.  检测皮肤颜色,确定皮肤占图像的比率

2. 根据皮肤比率进行边缘检测,产出细节映射图

3. 基于细节映射图和磨皮强度进行保边降噪

4. 对降噪好的图进行再一次肤色检测,保留肤色区域的降噪,其他区域还原为原图

步骤比较简单,但是要同时兼顾效果性能,是很不容易的。

当然这个算法肤色检测那一部分可以采用深度学习“语义分割”方面的思路进而改进效果。

做得好,将本算法改良到准商用,惊艳的程度是没有问题的。

深度学习相关技术就不展开细说了,有能力的朋友,感兴趣的话,可以自行实操。

完整源代码开源地址:

https://github.com/cpuimage/skin_smoothing

项目没有第三方依赖,完整纯c代码。

有编译问题的同学自行参考《Windows下C,C++开发环境搭建指南》搭建编译环境。

附上算法效果的示例:

以上,权当抛砖引玉之用。

授人以鱼不如授人以渔。

2020年,疫情之下,

愿大家都能事业有成,身体健康。

世界和平,人们皆友爱。

若有其他相关问题或者需求也可以邮件联系俺探讨。

邮箱地址是: gaozhihan@vip.qq.com

磨皮美颜算法 附完整C代码的更多相关文章

  1. 音频降噪算法 附完整C代码

    降噪是音频图像算法中的必不可少的. 目的肯定是让图片或语音 更加自然平滑,简而言之,美化. 图像算法和音频算法 都有其共通点. 图像是偏向 空间 处理,例如图片中的某个区域. 图像很多时候是以二维数据 ...

  2. mser 最大稳定极值区域(文字区域定位)算法 附完整C代码

    mser 的全称:Maximally Stable Extremal Regions 第一次听说这个算法时,是来自当时部门的一个同事, 提及到他的项目用它来做文字区域的定位,对这个算法做了一些优化. ...

  3. 基于RNN的音频降噪算法 (附完整C代码)

    前几天无意间看到一个项目rnnoise. 项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法. 采用的是 GRU/LSTM 模型. 阅读下训练代码,可 ...

  4. 音频自动增益 与 静音检测 算法 附完整C代码

    前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. ...

  5. 音频自动增益 与 静音检测 算法 附完整C代码【转】

    转自:https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用 ...

  6. 自动曝光修复算法 附完整C代码

    众所周知, 图像方面的3A算法有: AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了 ...

  7. 基于傅里叶变换的音频重采样算法 (附完整c代码)

    前面有提到音频采样算法: WebRTC 音频采样算法 附完整C++示例代码 简洁明了的插值音频重采样算法例子 (附完整C代码) 近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题. 坦白讲, ...

  8. 图片文档倾斜矫正算法 附完整c代码

    2年前在学习图像算法的时候看到一个文档倾斜矫正的算法. 也就是说能将一些文档图像进行旋转矫正, 当然这个算法一般用于一些文档扫描软件做后处理 或者用于ocr 文字识别做前处理. 相关的关键词: 抗倾斜 ...

  9. 3D Lut 电影级调色算法 附完整C代码

    在前面的文章,我提到过VSCO Cam 的胶片滤镜算法实现是3d lut. 那么3d lut  到底是个什么东西呢? 或者说它是用来做什么的? 长话短说,3d lut(全称 : 3D Lookup t ...

随机推荐

  1. Dell KACE K1000 poc

    POST /service/krashrpt.php HTTP/1.1 Host: xxx.com User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x ...

  2. SpringBoot实现微信小程序登录的完整例子

    目录 一.登录流程 二.后端实现 1.SpringBoot项目结构树 2.实现auth.code2Session 接口的封装 3.建立用户信息表及用户增删改查的管理 4.实现登录认证及令牌生成 三.前 ...

  3. Ratel源码-C/S事件梳理

    一.Ratel介绍 Ratel 是一个可以在命令行中玩斗地主的项目,可以使用小巧的jar包在拥有JVM环境的终端中进行游戏,同时支持人人对战和人机对战两种模式,丰富你的空闲时间! 二.玩法Demo 三 ...

  4. Beta冲刺——5.26

    这个作业属于哪个课程 软件工程 这个作业要求在哪里 Beta冲刺 这个作业的目标 Beta冲刺 作业正文 正文 github链接 项目地址 其他参考文献 无 一.会议内容 1.组员一起学习Git分支管 ...

  5. Rocket - debug - DebugTransport

    https://mp.weixin.qq.com/s/EcsuTjb4hFF9Ncig9Gfhew 简单介绍DebugTransport的实现. 1. JtagDTMConfig 1) JtagDTM ...

  6. 移动端fixed兼容问题

    最近做移动端页面,有个需求类似下图 底部导航用fixed定位时在部分iOS版本中会有问题: 1.上滑是底部会跟着滑动,手指松开时才会又回到底部 2.软键盘唤起的情况下,也会出现许多莫名其妙的问题 网上 ...

  7. Java实现 LeetCode 722 删除注释(暴力筛选)

    722. 删除注释 给一个 C++ 程序,删除程序中的注释.这个程序source是一个数组,其中source[i]表示第i行源码. 这表示每行源码由\n分隔. 在 C++ 中有两种注释风格,行内注释和 ...

  8. Java实现 LeetCode 629 K个逆序对数组(动态规划+数学)

    629. K个逆序对数组 给出两个整数 n 和 k,找出所有包含从 1 到 n 的数字,且恰好拥有 k 个逆序对的不同的数组的个数. 逆序对的定义如下:对于数组的第i个和第 j个元素,如果满i < ...

  9. java实现第五届蓝桥杯供水设施

    供水设施 X星球的居民点很多.Pear决定修建一个浩大的水利工程,以解决他管辖的N个居民点的供水问题.现在一共有N个水塔,同时也有N个居民点,居民点在北侧从1号到N号自西向东排成一排:水塔在南侧也从1 ...

  10. EasyARM-iMX257 linxu两年前的笔记

    第三章续:简单总结第三章中出现的命令! 1)  root@EasyARM-iMX257 ~# ddif=/dev/zero of=/dev/shm/disk bs=1024 count=10240 d ...