人脸姿态校正算法附完整C++示例代码

在一些特殊情况下，经常需要依据图像中的人脸，对图片进行倾斜矫正。

例如拍照角度幅度过大之类的情况，而进行人工矫正确实很叫人头大。

那是不是可以有一种算法，可以根据人脸的信息对图片进行角度的修复呢？

答案肯定是确认的。

再次例如，想要通过人脸的特征对人物的表情和情绪进行精准判断，

那么这个时候如果能确保人脸没有发现严重倾斜，无疑对准确率判断有一定的帮助。

那么假如一张图片只有一个人脸，其实很好判断，通过眼睛的位置的坐标，根据两眼的直线角度，

就可以计算出修正的角度。

然后旋转图片到对应角度即可。

但是如果，一张图片存在多张人脸的时候该怎么办？

有两种方法：

1.找到最大的那个人脸，以它为基准

2.找到频次最高的人脸角度，以频次为基准

当然在大多数情况，方法1是比较合理的。

这两个种情况就留给各位看官去实现了。

本人仅仅考虑一张人脸的情况，演示如何实现该功能。

倾斜角度计算的代码如下:

    float diffEyeX = right_eye_x - left_eye_x;

    float diffEyeY = right_eye_y - left_eye_y;

    float fAngle;

    float M_PI = 3.1415926535897932384626433832795f;

    if (fabs(diffEyeX) < 0.0000001f)

        fAngle = .f;

    else

        fAngle = atanf(diffEyeY / diffEyeX) * 180.0f / M_PI;

如果看不明白，需要好好补一下高中数学基础。

为了节约时间，直接复用《自动红眼移除算法附c++完整代码》的代码。

增加函数如下:

void RotateBilinear(unsigned char *sourceData, int width, int height, int Channels, int RowBytes,

                    unsigned char *destinationData, int newWidth, int newHeight, float angle, bool keepSize = true,

                    int fillColorR = , int fillColorG = , int fillColorB = ) {

    if (sourceData == NULL || destinationData == NULL) return;

    float oldXradius = (float) (width - ) / ;

    float oldYradius = (float) (height - ) / ;

    float newXradius = (float) (newWidth - ) / ;

    float newYradius = (float) (newHeight - ) / ;

    double MPI = 3.14159265358979323846;

    double angleRad = -angle * MPI / 180.0;

    float angleCos = (float) cos(angleRad);

    float angleSin = (float) sin(angleRad);

    int srcStride = RowBytes;

    int dstOffset = newWidth * Channels - ((Channels == ) ? newWidth : newWidth * Channels);

    unsigned char fillR = fillColorR;

    unsigned char fillG = fillColorG;

    unsigned char fillB = fillColorB;

    unsigned char *src = (unsigned char *) sourceData;

    unsigned char *dst = (unsigned char *) destinationData;

    int ymax = height - ;

    int xmax = width - ;

    if (Channels == ) {

        float cy = -newYradius;

        for (int y = ; y < newHeight; y++) {

            float tx = angleSin * cy + oldXradius;

            float ty = angleCos * cy + oldYradius;

            float cx = -newXradius;

            for (int x = ; x < newWidth; x++, dst++) {

                float ox = tx + angleCos * cx;

                float oy = ty - angleSin * cx;

                int ox1 = (int) ox;

                int oy1 = (int) oy;

                if ((ox1 < ) || (oy1 < ) || (ox1 >= width) || (oy1 >= height)) {

                    *dst = fillG;

                } else {

                    int ox2 = (ox1 == xmax) ? ox1 : ox1 + ;

                    int oy2 = (oy1 == ymax) ? oy1 : oy1 + ;

                    float dx1 = ;

                    if ((dx1 = ox - (float) ox1) < )

                        dx1 = ;

                    float dx2 = 1.0f - dx1;

                    float dy1 = ;

                    if ((dy1 = oy - (float) oy1) < )

                        dy1 = ;

                    float dy2 = 1.0f - dy1;

                    unsigned char *p1 = src + oy1 * srcStride;

                    unsigned char *p2 = src + oy2 * srcStride;

                    *dst = (unsigned char) (dy2 * (dx2 * p1[ox1] + dx1 * p1[ox2]) +

                                            dy1 * (dx2 * p2[ox1] + dx1 * p2[ox2]));

                }

                cx++;

            }

            cy++;

            dst += dstOffset;

        }

    } else if (Channels == ) {

        float cy = -newYradius;

        for (int y = ; y < newHeight; y++) {

            float tx = angleSin * cy + oldXradius;

            float ty = angleCos * cy + oldYradius;

            float cx = -newXradius;

            for (int x = ; x < newWidth; x++, dst += Channels) {

                float ox = tx + angleCos * cx;

                float oy = ty - angleSin * cx;

                int ox1 = (int) ox;

                int oy1 = (int) oy;

                if ((ox1 < ) || (oy1 < ) || (ox1 >= width) || (oy1 >= height)) {

                    dst[] = fillR;

                    dst[] = fillG;

                    dst[] = fillB;

                } else {

                    int ox2 = (ox1 == xmax) ? ox1 : ox1 + ;

                    int oy2 = (oy1 == ymax) ? oy1 : oy1 + ;

                    float dx1 = ;

                    if ((dx1 = ox - (float) ox1) < )

                        dx1 = ;

                    float dx2 = 1.0f - dx1;

                    float dy1 = ;

                    if ((dy1 = oy - (float) oy1) < )

                        dy1 = ;

                    float dy2 = 1.0f - dy1;

                    unsigned char *p1 = src + oy1 * srcStride;

                    unsigned char *p2 = p1;

                    p1 += ox1 * Channels;

                    p2 += ox2 * Channels;

                    unsigned char *p3 = src + oy2 * srcStride;

                    unsigned char *p4 = p3;

                    p3 += ox1 * Channels;

                    p4 += ox2 * Channels;

                    dst[] = (unsigned char) (

                            dy2 * (dx2 * p1[] + dx1 * p2[]) +

                            dy1 * (dx2 * p3[] + dx1 * p4[]));

                    dst[] = (unsigned char) (

                            dy2 * (dx2 * p1[] + dx1 * p2[]) +

                            dy1 * (dx2 * p3[] + dx1 * p4[]));

                    dst[] = (unsigned char) (

                            dy2 * (dx2 * p1[] + dx1 * p2[]) +

                            dy1 * (dx2 * p3[] + dx1 * p4[]));

                }

                cx++;

            }

            cy++;

            dst += dstOffset;

        }

    } else if (Channels == ) {

        float cy = -newYradius;

        for (int y = ; y < newHeight; y++) {

            float tx = angleSin * cy + oldXradius;

            float ty = angleCos * cy + oldYradius;

            float cx = -newXradius;

            for (int x = ; x < newWidth; x++, dst += Channels) {

                float ox = tx + angleCos * cx;

                float oy = ty - angleSin * cx;

                int ox1 = (int) ox;

                int oy1 = (int) oy;

                if ((ox1 < ) || (oy1 < ) || (ox1 >= width) || (oy1 >= height)) {

                    dst[] = fillR;

                    dst[] = fillG;

                    dst[] = fillB;

                    dst[] = ;

                } else {

                    int ox2 = (ox1 == xmax) ? ox1 : ox1 + ;

                    int oy2 = (oy1 == ymax) ? oy1 : oy1 + ;

                    float dx1 = ;

                    if ((dx1 = ox - (float) ox1) < )

                        dx1 = ;

                    float dx2 = 1.0f - dx1;

                    float dy1 = ;

                    if ((dy1 = oy - (float) oy1) < )

                        dy1 = ;

                    float dy2 = 1.0f - dy1;

                    unsigned char *p1 = src + oy1 * srcStride;

                    unsigned char *p2 = p1;

                    p1 += ox1 * Channels;

                    p2 += ox2 * Channels;

                    unsigned char *p3 = src + oy2 * srcStride;

                    unsigned char *p4 = p3;

                    p3 += ox1 * Channels;

                    p4 += ox2 * Channels;

                    dst[] = (unsigned char) (

                            dy2 * (dx2 * p1[] + dx1 * p2[]) +

                            dy1 * (dx2 * p3[] + dx1 * p4[]));

                    dst[] = (unsigned char) (

                            dy2 * (dx2 * p1[] + dx1 * p2[]) +

                            dy1 * (dx2 * p3[] + dx1 * p4[]));

                    dst[] = (unsigned char) (

                            dy2 * (dx2 * p1[] + dx1 * p2[]) +

                            dy1 * (dx2 * p3[] + dx1 * p4[]));

                    dst[] = ;

                }

                cx++;

            }

            cy++;

            dst += dstOffset;

        }

    }

}

void facialPoseCorrection(unsigned char *inputImage, int Width, int Height, int Channels, int left_eye_x, int left_eye_y,

                    int right_eye_x, int right_eye_y) {

    float diffEyeX = right_eye_x - left_eye_x;

    float diffEyeY = right_eye_y - left_eye_y;

    float fAngle;

    float M_PI = 3.1415926535897932384626433832795f;

    if (fabs(diffEyeX) < 0.0000001f)

        fAngle = .f;

    else

        fAngle = atanf(diffEyeY / diffEyeX) * 180.0f / M_PI;

    size_t numberOfPixels = Width * Height * Channels * sizeof(unsigned char);

    unsigned char *outputImage = (unsigned char *) malloc(numberOfPixels);

    if (outputImage != nullptr) {

        RotateBilinear(inputImage, Width, Height, Channels, Width * Channels, outputImage, Width, Height, fAngle);

        memcpy(inputImage, outputImage, numberOfPixels);

        free(outputImage);

    }

}

上效果图片。

原图：

红眼修复+倾斜矫正:

项目地址:

https://github.com/cpuimage/MTCNN

命令行参数:

mtcnn 模型文件路径图片路径

例如: mtcnn ../models ../sample.jpg

用cmake即可进行编译示例代码，详情见CMakeLists.txt。

若有其他相关问题或者需求也可以邮件联系俺探讨。

邮箱地址是:
gaozhihan@vip.qq.com

人脸姿态校正算法附完整C++示例代码的更多相关文章

WebRTC 音频采样算法附完整C++示例代码
之前有大概介绍了音频采样相关的思路,详情见<简洁明了的插值音频重采样算法例子 (附完整C代码)>. 音频方面的开源项目很多很多. 最知名的莫过于谷歌开源的WebRTC, 其中的音频模块就包 ...
基于傅里叶变换的音频重采样算法 (附完整c代码)
前面有提到音频采样算法: WebRTC 音频采样算法附完整C++示例代码简洁明了的插值音频重采样算法例子 (附完整C代码) 近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题. 坦白讲, ...
音频降噪算法附完整C代码
降噪是音频图像算法中的必不可少的. 目的肯定是让图片或语音更加自然平滑,简而言之,美化. 图像算法和音频算法都有其共通点. 图像是偏向空间处理,例如图片中的某个区域. 图像很多时候是以二维数据 ...
mser 最大稳定极值区域(文字区域定位)算法附完整C代码
mser 的全称:Maximally Stable Extremal Regions 第一次听说这个算法时,是来自当时部门的一个同事, 提及到他的项目用它来做文字区域的定位,对这个算法做了一些优化. ...
磨皮美颜算法附完整C代码
前言 2017年底时候写了这篇<集降噪美颜虚化增强为一体的极速图像润色算法附Demo程序> 这也算是学习过程中比较有成就感的一个算法. 自2015年做算法开始到今天,还有个把月 ...
基于RNN的音频降噪算法 (附完整C代码)
前几天无意间看到一个项目rnnoise. 项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法. 采用的是 GRU/LSTM 模型. 阅读下训练代码,可 ...
音频自动增益与静音检测算法附完整C代码
前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. ...
音频自动增益与静音检测算法附完整C代码【转】
转自:https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用 ...
图片文档倾斜矫正算法附完整c代码
2年前在学习图像算法的时候看到一个文档倾斜矫正的算法. 也就是说能将一些文档图像进行旋转矫正, 当然这个算法一般用于一些文档扫描软件做后处理或者用于ocr 文字识别做前处理. 相关的关键词: 抗倾斜 ...

随机推荐

【一天一道LeetCode】#99. Recover Binary Search Tree
一天一道LeetCode 本系列文章已全部上传至我的github,地址:ZeeCoder's Github 欢迎大家关注我的新浪微博,我的新浪微博欢迎转载,转载请注明出处 (一)题目 Two ele ...
工作中常用的Linux命令
1.从其他机器拷贝文件夹格式: scp -r 文件夹名用户名@机器名:/路径范例: scp -rsearch work@zjm-testing-ps23.zjm.baidu.com:/home/ ...
文件I/O实践(2) --文件stat
功能:获取文件元数据 #include <sys/types.h> #include <sys/stat.h> #include <unistd.h> int st ...
程序员的软实力武器-smart原则
smart对于程序员来说不是仅仅意味一个法则: 面对需求和提出需求时候,smart原则可以极大的提高效率目标管理是使管理者的工作由被动变为主动的一个很好的管理手段,实施目标管理不仅是为了利于员工更加 ...
21_Android中常见对话框，光传感器，通过重力感应器编写出指南针应用，帧动画，通过Jav代码的方式编写补间动画，通过XML的方式编写补间动画
1 关于常见的对话框,主要有: 常见的对话框,单选对话框,多选对话框,进度条对话框(转圈类型的),带进度条的对话框. 案例结构: 完成如下结构的案例,将所有的案例都测试一下: 2 编写MainA ...
Linux管理日记(二)
14 启动内网端口转发 ### 2. 查看IP以及网卡信息 # 可以发现, eth0 的地址 inet addr:10.144.7.195, 此为内网网卡 # 公网网卡, eth1 的地址 inet ...
RabbitMQ安装使用详解
1.下载相应的版本安装:http://www.rabbitmq.com/download.htmleg:http://www.rabbitmq.com/releases/rabbitmq-server ...
自己动手写web框架----2
在上一节,我们自己写的web框架,只能运行显示一个HelloWorld.现在我们对其进行一次加工,让他至少能运行一个登陆程序. 首先看login.jsp <%@ page contentType ...
Android官方技术文档翻译——开发工具的构建概述
本文译自Android官方技术文档<Build Overview>,原文地址:http://tools.android.com/build. 因为<Android Lint Chec ...
Erlang Rebar 使用指南之二：制作发布版本
Erlang Rebar 使用指南之二:制作发布版本全文目录: https://github.com/rebar/rebar/wiki 本章位置: https://github.com/rebar/ ...

人脸姿态校正算法 附完整C++示例代码

人脸姿态校正算法 附完整C++示例代码的更多相关文章

随机推荐

热门专题

人脸姿态校正算法附完整C++示例代码

人脸姿态校正算法附完整C++示例代码的更多相关文章