[OpenCV实战]29 使用OpenCV实现红眼自动去除
目录
在本教程中,我们将学习如何完全自动地从照片中消除红眼。如下图所示:
当我们晚上拍摄的照片有红眼效果时,带着血腥眼睛的微笑的人会让人想起德古拉。使用照片编辑工具可以删除红眼,但是需要很长的时间来学习。构建一个可用于各种图像的强大的红眼消除应用程序超出了本文的范围。但是,我们将学习基本原理并验证效果。
什么原因导致闪光灯拍照中的红眼效应?
当你在一个黑暗的房间里时,你的瞳孔会扩张(放大)以获得更多光线帮助你看得更清楚。大多数相机的闪光灯都非常靠近镜头。当您使用闪光灯拍摄照片时,来自闪光灯的光线会通过放大的瞳孔传到眼球的后部,然后通过瞳孔返回到相机的镜头中。眼球的后部称为眼底。由于眼底血液供应充足,它呈红色。
眼底的图像显示在下面。检查眼底可以揭示很多关于一个人的健康。您甚至可以获得智能手机应用程序,帮助您通过附件查看眼底。大多数相机持续闪烁几秒,使瞳孔收缩,从而减少红眼的可能性。
1 红眼消除
在本节中,我们将逐步介绍用于自动消除红眼的算法。
1.1 眼部检测
第一步是自动检测眼睛。我们使用标准的OpenCV Haar探测器(haarcascade_eye.xml)来寻找眼睛。有时,首先运行面部检测器然后检测面部区域内的眼睛是有意义的。为了简单起见,我们直接在图像上运行眼睛检测器。当输入图像是人像拍摄,或者您有眼睛的特写镜头时,跳过面部检测器。
您也可以按照此处的说明训练您自己的HAAR物体探测器。
https://www.learnopencv.com/training-better-haar-lbp-cascade-eye-detector-opencv
人眼检测模型调用代码如下:
C++:
// Read image
Mat img = imread("red_eyes.jpg",CV_LOAD_IMAGE_COLOR);
// Output image
Mat imgOut = img.clone();
// Load HAAR cascade
CascadeClassifier eyes_cascade("haarcascade_eye.xml");
// A vector of Rect for storing bounding boxes for eyes.
std::vector<Rect> eyes;
// Detect eyes.
eyesCascade.detectMultiScale( img, eyes, 1.3, 4, 0 | CASCADE_SCALE_IMAGE, Size(100, 100) );
Python:
# Read image
img = cv2.imread("red_eyes.jpg", cv2.IMREAD_COLOR)
# Output image
imgOut = img.copy()
# Load HAAR cascade
eyesCascade = cv2.CascadeClassifier("haarcascade_eye.xml")
# Detect eyes
eyes = eyesCascade.detectMultiScale(img,scaleFactor=1.3, minNeighbors=4, minSize=(100, 100))
1.2 红眼遮掩
接下来,我们需要找到受红眼影响的瞳孔部分。有许多不同的方法可以找到红色的东西。需要注意的一点是,我们的颜色不仅仅是红色,而是鲜红色!您可以将图像转换为HSV色彩空间并根据色调和亮度设定阈值。在这篇文章中,我们使用了一个更简单的启发式方法。红色通道值大于阈值,阈值为绿色和蓝色通道的总和时,则判断当前颜色为红色。出于概念验证系统的目的,这个方法是足够的,但如果你想为商业软件包建立自动防红眼,你需要收集成千上万的红眼图像来提出更好的东西。
在下面的代码中,我们遍历我们在上一步中检测到的所有眼睛矩形。然后我们使用命令split将彩色图像分割成三个通道。最后对于每个像素点,如果红色通道高于阈值(150),且红色通道大于绿色和蓝色通道的总和,则该点值设为255,否则为0。则得到掩模图像,掩模图像中红眼位置为白色,其他位置为黑色。代码如下:
C++:
for( size_t i = 0; i < eyes.size(); i++ )
{
// Extract eye from the image.
Mat eye = img(eyes[i]);
// Split eye image into 3 channels.
vector<Mat>bgr(3);
split(eye,bgr);
// Simple red eye detector
Mat mask = (bgr[2] > 150) & (bgr[2] > ( bgr[1] + bgr[0] ));
}
Python:
for (x, y, w, h) in eyes:
# Extract eye from the image.
eye = img[y:y+h, x:x+w]
# Split eye image into 3 channels
b = eye[:, :, 0]
g = eye[:, :, 1]
r = eye[:, :, 2]
# Add the green and blue channels.
bg = cv2.add(b, g)
# Simple red eye detector
mask = (r > 150) & (r > bg)
# Convert the mask to uint8 format.
mask = mask.astype(np.uint8)*255
1.3 清除瞳孔掩模空洞
在上一步中创建的掩模中很可能会有洞。下图中的左图显示了使用颜色处理获得的原始掩模处理步骤。首先获得有孔洞的掩模,然后填充孔洞,最后扩充孔洞。此外,扩大面罩是一个好主意,因此它覆盖了稍大的区域。这是因为在边界处颜色逐渐消失,并且在我们的原始掩模中可能没有捕捉到一些红色区域。在下图中,右图是扩大的掩模。我们使用下面代码删除了掩码中的漏洞并生成扩张掩码。
代码如下:
C++:
void fillHoles(Mat &mask)
{
Mat mask_floodfill = mask.clone();
floodFill(mask_floodfill, cv::Point(0,0), Scalar(255));
Mat mask2;
bitwise_not(mask_floodfill, mask2);
mask = (mask2 | mask);
}
// Clean up mask by filling holes and dilating
fillHoles(mask);
dilate(mask, mask, Mat(), Point(-1, -1), 3, 1, 1);
Python:
def fillHoles(mask):
maskFloodfill = mask.copy()
h, w = maskFloodfill.shape[:2]
maskTemp = np.zeros((h+2, w+2), np.uint8)
cv2.floodFill(maskFloodfill, maskTemp, (0, 0), 255)
mask2 = cv2.bitwise_not(maskFloodfill)
return mask2 | mask
# Clean up mask by filling holes and dilating
mask = fillHoles(mask)
mask = cv2.dilate(mask, None, anchor=(-1, -1), iterations=3, borderType=1, borderValue=1)
1.4 红眼修复
现在我们有一个只包含每只眼睛红色区域的面具。我们接下来展示如何处理这个面具内的区域来修复红眼。
我们知道红眼睛会使图像中的红色通道饱和。换句话说,红色通道中的所有信息都被破坏。我们怎样才能恢复一些这些信息呢?修复红眼时,我们不需要在红色通道中检索真正的底层信息; 我们只需要找到合理的信息。幸运的是,红眼效果仅在红色通道中破坏眼球信息; 蓝色和绿色通道仍然很好。您可以在下图中看到图像的红色,绿色和蓝色通道下的眼球信。
可以使用绿色和蓝色通道的组合来提供合理的红色通道。例如,我们可以创建一个红色通道,它是图像中绿色和蓝色通道的平均值。然而,这样做可能会给眼球一点点色调,看起来不错,但不是很好。注意中心图像中间图像的紫色。
这给我们带来了一个重要的问题。瞳孔的颜色应该是多少?眼睛的内部是完全黑色的。因此,瞳孔应该是无色的(灰度)和黑暗的。我们不是仅替换瞳孔区域中的红色通道,而是用绿色和蓝色通道的平均值替换所有通道。这消除了紫色调。如上图第三张图像。最后一步是合并三个通道以创建RGB图像,然后将此固定的眼睛区域替换原始图像眼睛区域中。
代码如下:
C++:
// Calculate the mean channel by averaging
// the green and blue channels
Mat mean = (bgr[0]+bgr[1])/2;
// Copy the mean image to blue channel with mask.
mean.copyTo(bgr[0], mask);
// Copy the mean image to green channel with mask.
mean.copyTo(bgr[1], mask);
// Copy the mean image to red channel with mask.
mean.copyTo(bgr[2], mask);
// Merge the three channels
Mat eyeOut;
merge(bgr,eyeOut);
// Copy the fixed eye to the output image.
eyeOut.copyTo(imgOut(eyes[i]));
python:
# Calculate the mean channel by averaging
# the green and blue channels. Recall, bg = cv2.add(b, g)
mean = bg / 2
mask = mask.astype(np.bool)[:, :, np.newaxis]
mean = mean[:, :, np.newaxis]
# Copy the eye from the original image.
eyeOut = eye.copy()
# Copy the mean image to the output image.
np.copyto(eyeOut, mean, where=mask)
# Copy the fixed eye to the output image.
imgOut[y:y+h, x:x+w, :] = eyeOut
2 结果与完整代码
2.1 结果
我们首先在开始的示例图像上显示结果。结果如图所示:
请注意,从瞳孔区域移除所有颜色会使图像看起来很漂亮,因为眼睛中心的点是完全白色的。还要注意,在瞳孔的边界上,红色消失,但是由于扩张操作,我们仍然捕获该区域。
接下来,我们在眼睛的特写照片上显示结果,如下图所示。如果我们使用了人脸检测器,它就不会检测到人脸,并且自动眼睛检测器不会起作用。
2.2 代码
本文所有代码和人眼检测模型见:
https://github.com/luohenyueji/OpenCV-Practical-Exercise
完整代码如下:
C++:
#include "pch.h"
#include <opencv2/opencv.hpp>
using namespace std;
using namespace cv;
//孔洞填充
void fillHoles(Mat &mask)
{
Mat maskFloodfill = mask.clone();
//漫水填充
floodFill(maskFloodfill, cv::Point(0, 0), Scalar(255));
Mat mask2;
//反色
bitwise_not(maskFloodfill, mask2);
//或运算
mask = (mask2 | mask);
}
int main()
{
// Read image 读彩色图像
Mat img = imread("./image/red_eyes.jpg", CV_LOAD_IMAGE_COLOR);
// Output image 输出图像
Mat imgOut = img.clone();
// Load HAAR cascade 读取haar分类器
CascadeClassifier eyesCascade("./model/haarcascade_eye.xml");
// Detect eyes 检测眼睛
std::vector<Rect> eyes;
//前四个参数:输入图像,眼睛结果,表示每次图像尺寸减小的比例,表示每一个目标至少要被检测到4次才算是真的
//后两个参数:0 | CASCADE_SCALE_IMAGE表示不同的检测模式,最小检测尺寸
eyesCascade.detectMultiScale(img, eyes, 1.3, 4, 0 | CASCADE_SCALE_IMAGE, Size(100, 100));
// For every detected eye 每只眼睛都进行处理
for (size_t i = 0; i < eyes.size(); i++)
{
// Extract eye from the image. 提取眼睛图像
Mat eye = img(eyes[i]);
// Split eye image into 3 channels. 颜色分离
vector<Mat>bgr(3);
split(eye, bgr);
// Simple red eye detector 红眼检测器,获得结果掩模
Mat mask = (bgr[2] > 150) & (bgr[2] > (bgr[1] + bgr[0]));
// Clean mask 清理掩模
//填充孔洞
fillHoles(mask);
//扩充孔洞
dilate(mask, mask, Mat(), Point(-1, -1), 3, 1, 1);
// Calculate the mean channel by averaging the green and blue channels
//计算b通道和g通道的均值
Mat mean = (bgr[0] + bgr[1]) / 2;
//用该均值图像覆盖原图掩模部分图像
mean.copyTo(bgr[2], mask);
mean.copyTo(bgr[0], mask);
mean.copyTo(bgr[1], mask);
// Merge channels
Mat eyeOut;
//图像合并
cv::merge(bgr, eyeOut);
// Copy the fixed eye to the output image.
// 眼部图像替换
eyeOut.copyTo(imgOut(eyes[i]));
}
// Display Result
imshow("Red Eyes", img);
imshow("Red Eyes Removed", imgOut);
waitKey(0);
return 0;
}
python:
import cv2
import numpy as np
def fillHoles(mask):
maskFloodfill = mask.copy()
h, w = maskFloodfill.shape[:2]
maskTemp = np.zeros((h+2, w+2), np.uint8)
cv2.floodFill(maskFloodfill, maskTemp, (0, 0), 255)
mask2 = cv2.bitwise_not(maskFloodfill)
return mask2 | mask
if __name__ == '__main__' :
# Read image
img = cv2.imread("./image/red_eyes.jpg", cv2.IMREAD_COLOR)
# Output image
imgOut = img.copy()
# Load HAAR cascade
eyesCascade = cv2.CascadeClassifier("./model/haarcascade_eye.xml")
# Detect eyes
eyes = eyesCascade.detectMultiScale(img, scaleFactor=1.3, minNeighbors=4, minSize=(100, 100))
# For every detected eye
for (x, y, w, h) in eyes:
# Extract eye from the image
eye = img[y:y+h, x:x+w]
# Split eye image into 3 channels
b = eye[:, :, 0]
g = eye[:, :, 1]
r = eye[:, :, 2]
# Add the green and blue channels.
bg = cv2.add(b, g)
# Simple red eye detector.
mask = (r > 150) & (r > bg)
# Convert the mask to uint8 format.
mask = mask.astype(np.uint8)*255
# Clean mask -- 1) File holes 2) Dilate (expand) mask.
mask = fillHoles(mask)
mask = cv2.dilate(mask, None, anchor=(-1, -1), iterations=3, borderType=1, borderValue=1)
# Calculate the mean channel by averaging
# the green and blue channels
mean = bg / 2
mask = mask.astype(np.bool)[:, :, np.newaxis]
mean = mean[:, :, np.newaxis]
# Copy the eye from the original image.
eyeOut = eye.copy()
# Copy the mean image to the output image.
#np.copyto(eyeOut, mean, where=mask)
eyeOut = np.where(mask, mean, eyeOut)
# Copy the fixed eye to the output image.
imgOut[y:y+h, x:x+w, :] = eyeOut
# Display Result
cv2.imshow('Red Eyes', img)
cv2.imshow('Red Eyes Removed', imgOut)
cv2.waitKey(0)
3 参考
https://www.learnopencv.com/automatic-red-eye-remover-using-opencv-cpp-python/
[OpenCV实战]29 使用OpenCV实现红眼自动去除的更多相关文章
- [OpenCV实战]45 基于OpenCV实现图像哈希算法
目前有许多算法来衡量两幅图像的相似性,本文主要介绍在工程领域最常用的图像相似性算法评价算法:图像哈希算法(img hash).图像哈希算法通过获取图像的哈希值并比较两幅图像的哈希值的汉明距离来衡量两幅 ...
- [OpenCV实战]50 用OpenCV制作低成本立体相机
本文主要讲述利用OpenCV制作低成本立体相机以及如何使用OpenCV创建3D视频,准确来说是模仿双目立体相机,我们通常说立体相机一般是指双目立体相机,就是带两个摄像头的那种(目就是指眼睛,双目就是两 ...
- [OpenCV实战]48 基于OpenCV实现图像质量评价
本文主要介绍基于OpenCV contrib中的quality模块实现图像质量评价.图像质量评估Image Quality Analysis简称IQA,主要通过数学度量方法来评价图像质量的好坏. 本文 ...
- [OpenCV实战]47 基于OpenCV实现视觉显著性检测
人类具有一种视觉注意机制,即当面对一个场景时,会选择性地忽略不感兴趣的区域,聚焦于感兴趣的区域.这些感兴趣的区域称为显著性区域.视觉显著性检测(Visual Saliency Detection,VS ...
- [OpenCV实战]46 在OpenCV下应用图像强度变换实现图像对比度均衡
本文主要介绍基于图像强度变换算法来实现图像对比度均衡.通过图像对比度均衡能够抑制图像中的无效信息,使图像转换为更符合计算机或人处理分析的形式,以提高图像的视觉价值和使用价值.本文主要通过OpenCV ...
- [OpenCV实战]44 使用OpenCV进行图像超分放大
图像超分辨率(Image Super Resolution)是指从低分辨率图像或图像序列得到高分辨率图像.图像超分辨率是计算机视觉领域中一个非常重要的研究问题,广泛应用于医学图像分析.生物识别.视频监 ...
- [OpenCV实战]24 使用OpenCV进行曝光融合
目录 1 什么是曝光融合 2 曝光融合的原理 3 代码与结果 4 参考 本教程中,我们将了解使用OpenCV的Exposure Fusion(曝光融合). 1 什么是曝光融合 曝光融合是一种将使用不同 ...
- [OpenCV实战]23 使用OpenCV获取高动态范围成像HDR
目录 1 背景 1.1 什么是高动态范围(HDR)成像? 1.2 高动态范围(HDR)成像如何工作? 2 代码 2.1 运行环境配置 2.2 读取图像和曝光时间 2.3 图像对齐 2.4 恢复相机响应 ...
- [OpenCV实战]38 基于OpenCV的相机标定
文章目录 1 什么是相机标定? 2 图像形成几何学 2.1 设定 2.1.1 世界坐标系 2.1.2 相机坐标系 2.1.3 图像坐标系 2.2 图像形成方法总结 3 基于OpenCV的相机标定原理 ...
随机推荐
- uni-app 如何优雅的使用权限认证并对本地文件上下起手
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 1.起因 最近有一个需求,需要使用自定义插件,来对接硬件功能,需要配合对手机的权限进行判断和提示,并在对接后对本地文件进行操作,这里给大家 ...
- Linux软件安装方式 - Tarball&RPM&YUM
软件安装 简介 概念详解 # 概念详解 - 开放源码: 程序码, 写给人类看的程序语言, 但机器并不认识, 所以无法执行; - 编译器: 将程序码转译成为机器看的懂得语言, 就类似翻译者的角色; - ...
- 线上kafka消息堆积,consumer掉线,怎么办?
线上kafka消息堆积,所有consumer全部掉线,到底怎么回事? 最近处理了一次线上故障,具体故障表现就是kafka某个topic消息堆积,这个topic的相关consumer全部掉线. 整体排查 ...
- VMware ESXi 8.0 SLIC 2.6 & macOS Unlocker (Oct 2022 GA)
ESXi 8.0.0 GA (General Availability) 请访问原文 VMware ESXi 8.0 SLIC 2.6 & macOS Unlocker (Oct 2022 G ...
- 嵌入式-C语言基础:指针是存放变量的地址,那为什么要区分类型?
指针是存放变量的地址,那为什么要区分类型?不能所有类型的变量都用一个类型吗?下面用一个例子来说明这个问题. #include<stdio.h> int main() { int a=0x1 ...
- 聊聊FASTER和进程内混合缓存
最近有一个朋友问我这样一个问题: 我的业务依赖一些数据,因为数据库访问慢,我把它放在Redis里面,不过还是太慢了,有什么其它的方案吗? 其实这个问题比较简单的是吧?Redis其实属于网络存储,我对照 ...
- RabbitMq消息手动应答、放回队列重新消费、设置队列消息持久化、分发模式
RabbitMq消息手动应答,放回队列重新消费,设置队列消息持久化 消息应答 概念 消费者完成一个任务可能需要一段时间,如果其中一个消费者处理一个长的任务并仅只完成了部分突然它挂掉了,会发生什么情况. ...
- hwlog--utils.go
// Copyright(C) 2021. Huawei Technologies Co.,Ltd. All rights reserved.// Package hwlog provides the ...
- 专业的C头文件设计和重构指南
头文件设计要点: 1. 头文件注释 2. guard define 3. 尽量不要在头文件中暴露数据结构 4. 要自包含,保证头文件独立编译和功能正确 5. 函数声明前加XXX_API利于拓展 6. ...
- 【ASP.NET Core】MVC控制器的各种自定义:修改参数的名称
在上一篇中,老周演示了通过实现约定接口的方式自定义控制器的名称. 至于说自定义操作方法的名称,就很简单了,因为有内置的特性类可以用.看看下面的例子. [Route("[controller] ...