虹软人脸识别——官方 Qt Demo 移植到 Linux
一、前言
最近需要在 Linux 平台下开发一个人脸识别相关的应用,用到了虹软的人脸识别 SDK。之前在 Windows 平台用过,感觉不错,SDK 里面还带了 Demo 可以快速看到效果。打开 Linux 版本的 SDK 里面没有发现 Demo,于是想着把 Windows 的 Demo 移植到 Linux。这篇文章记录了移植的过程,Linux 用的是 Ubuntu 20.04(使用虚拟机 VMware Workstation 15 Player)。
二、配置依赖
2.1 ArcFace SDK
到虹软官网下载人脸识别 SDK 3.1 Linux 增值版本 解压到合适的目录,并从官网获取 APP_ID、SDK_KEY 和 ACTIVE_KEY,用于写到配置文件用来激活 SDK。
2.2 OpenCV
到 OpenCV 官网下载源码,我用的版本是 3.4.9。可以按照官网的教程 Installation in Linux 自行编译,我参考官网教程使用下面的这些命令在 GCC 9.3.0(Ubuntu 20.04 自带的编译器) 上编译成功。
sudo apt update
sudo apt install build-essential
sudo apt install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev
cd <OpenCV 源码目录>
mkdir build
cd build
cmake -DCMAKE_BUILD_TYPE=Release -DCMAKE_INSTALL_PREFIX=<自定义目录> ..
make -j3 # 可以使用核心数 - 1 个线程来编译
sudo make install
2.3 Qt
Qt 使用的是 5.14.2 版本。
三、项目文件
3.1 .pro 文件
原 Windows Demo 使用的是 Visual Studio 2015,在 Linux 下我这里用到了 Qt Creator 进行开发,因此需要编写 .pro 文件,包括以下几个方面:
- 用到的 Qt 模块
- 编译出来的程序名
- 用到的头文件、源文件和资源文件
- 依赖库的头文件及库名
更具体的内容查看文末提供的源码。
3.2 文件编码
原源码文件使用的是 GBK 编码,需要转换为 UTF-8 编码。将下面的命令保存到 convert.sh
文件中并用 chmod u+x convert.sh
赋予可执行权限。
#!/bin/bash
for i in "$@"; do
desc=$(file "$i")
if $(echo $desc | grep -i "UTF-8 Unicode" > /dev/null); then
if $(echo $desc | grep -i "(with BOM)" > /dev/null); then
echo "Remove UTF-8 BOM: " $i
sed -i "1s/^\xef\xbb\xbf//" "$i"
fi
elif $(echo $desc | grep -i "ISO-8859" > /dev/null); then
echo "GBK --> UTF-8 : " $i
temp=temp.txt
iconv -f gbk -t utf-8 -o "$temp" "$i"
mv "$temp" "$i"
fi
done
在源码根目录下运行 find . -type f \( -name "*.h" -o -name "*.cpp" \) | xargs -I{} ./convert.sh "{}"
将所有的文件的编码从 GBK 转为 UTF-8,并去除现有 UTF-8 文件的 BOM 头。
四、代码修改
到这里已经可以用 Qt Creator 打开项目了,但在代码中还存在一些问题,一方面是原代码使用了一些 Windows 平台特有的 API,一方面是有些代码在 Linux 有兼容性问题。先去除 Windows 特有的依赖到编译通过,再补充必要的依赖,最后解决兼容性问题。
4.1 修改报错直至编译通过
直接进行编译,逐步解决编译错误,通过下面的方式可以解决编译错误:
- 删除 Utils.cpp 中报错的头文件、GUID 宏、listDevices 函数的主体、UTF8_To_string 和 string_To_UTF8 函数。
- 将所有包含的
qDebug
改为QDebug
。 - 将
Sleep(milli)
改为std::this_thread::sleep_for(std::chrono::milliseconds(milli))
。 - 删除 MSVC 的链接库的编译指令
#pragma comment ...
。 - 将原来使用 OpenCV 2 的接口迁移到目前的 OpenCV 3。
- IplImage 到 cv::Mat 的转换由
cv::Mat mat(ipl, false)
改成cv::Mat mat = cv::cvarrToMat(ipl)
。 - cv::Mat 到 IplImage 的转换由
IplImage(mat)
改成cvIplImage(mat)
,在原来的代码里 cv::Mat 转为 IplImage 后有个取地址,对右值取地址是不安全的,需要用一个变量保存转换后的值再对这个变量取地址。 - 在调用 cvRectangle 时将
CV_RGB
改成cvScalar
。 - 使用
cv::cvtColor
需要额外包含头文件opencv2/imgproc.hpp
。 - 使用
cv::VideoCapture
需要额外包含头文件opencv2/videoio.hpp
- IplImage 到 cv::Mat 的转换由
- 将
strcpy_s
改成strncpy
,仅有参数位置上的改变。 - 将
TRUE
改为true
,将FALSE
改为false
。
改了编译错误后,忽略警告已经可以编译通过了,接下来是补充刚才删除的一些必要依赖及解决兼容性问题。
因为环境差异,可能出现错误的顺序不一致,但基本上是上面提到的错误之一。
4.2 重新实现获取摄像头列表的函数
原 Windows Demo 使用了 Windows 特有的 dshow 来查找摄像头,在这里直接用 cv::VideoCapture 尝试打开来获取摄像头的索引:
auto list = std::vector<int>();
for (auto i = 0; i != 10; ++i)
{
auto cap = cv::VideoCapture(i);
if (cap.isOpened()) { list.emplace_back(i); }
cap.release();
}
Demo 可以只打开一个RGB摄像头,也可以同时打开一个RGB摄像头和一个IR摄像头。原代码保存获取摄像头的名称,仅用来统计数量,具体打开哪个摄像头是通过settings.ini
文件来配置的。在改变探测摄像头存在的数量的方式后,顺带改变了打开摄像头的逻辑,仅一个摄像头就认为是仅打开普通摄像头。在settings.ini
文件中配置两种摄像头的索引,如果索引为 -1,则自动把小的索引认为是普通摄像头,大的索引认为是红外摄像头,如果和真实情况不一致可手动指定摄像头索引。
settings.ini
文件在后面运行 Demo 时会有更多的说明。
4.3 修复弹出文件选择框失败的兼容性问题
在 Ubuntu 20.04 下,Qt 的 QFileDialog::getOpenFileName 和 QFileDialog::getExistingDirectory 存在一些问题,在打开时会卡死界面,通过将最后一个参数设置为 QFileDialog::DontUseNativeDialog
可以解决这个问题。
五、运行 Demo
5.1 界面预览
5.2 配置
- 配置文件已经随源码打包好了,在运行时需要移动到可执行程序所在的同级目录下。
- 在配置文件中填入官网获取的 APP_ID、SDK_KEY 和 ACTIVE_KEY。
- 编译并运行。
六、源码下载
虹软人脸识别——官方 Qt Demo 移植到 Linux的更多相关文章
- Android开发 打开已存在的项目(以虹软人脸识别sdk的demo为例)
详细流程参考博客https://blog.csdn.net/z979451341/article/details/79468785 个人遇到的问题与注意点 1.下载Demo后忘记修改appid和sdk ...
- 虹软人脸识别 - Android Camera实时人脸追踪画框适配
在使用虹软人脸识别Android SDK的过程中 ,预览时一般都需要绘制人脸框,但是和PC平台相机应用不同,在Android平台相机进行应用开发还需要考虑前后置相机切换.设备横竖屏切换等情况,因此在人 ...
- 虹软人脸识别SDK接入Milvus实现海量人脸快速检索
一.背景 人脸识别是近年来最热门的计算机视觉领域的应用之一,而且现在已经出现了非常多的人脸识别算法,如:DeepID.FaceNet.DeepFace等等.人脸识别被广泛应用于景区.客运.酒店.办公室 ...
- Android 关于虹软人脸识别SDK引擎使用总结
虹软 最近开放了人脸识别的SDK引擎(免费的哦),刚好有Android版的,就体验了一波.下面来说说Android版的SDK使用心得: ArcFace 虹软人脸认知引擎简介 目前开放的版本有人脸比对( ...
- 记C# 调用虹软人脸识别 那些坑
上一个东家是从事安防行业的,致力于人工智能领域,有自主人脸识别.步态识别的算法.C++同事比较称职有什么问题都可以第一时间反馈,并得到合理的处理,封装的DLL 是基于更高性能的GPU算法,可支持更多线 ...
- 虹软人脸识别SDK在网络摄像头中的实际应用
目前在人脸识别领域中,网络摄像头的使用很普遍,但接入网络摄像头和人脸识别SDK有一定门槛,在此篇中介绍过虹软人脸识别SDK的接入流程,本文着重介绍网络摄像头获取视频流并处理的流程(红色框内),以下内容 ...
- 虹软人脸识别 - faceId及IR活体检测的更新介绍
虹软人脸识别 - faceId及IR活体检测的介绍 前几天虹软推出了 Android ArcFace 2.2版本的SDK,相比于2.1版本,2.2版本中的变化如下: VIDEO模式新增faceId(类 ...
- 虹软人脸识别 - faceId及IR活体检测的介绍
虹软人脸识别 - faceId及IR活体检测的介绍 前几天虹软推出了 Android ArcFace 2.2版本的SDK,相比于2.1版本,2.2版本中的变化如下: VIDEO模式新增faceId(类 ...
- 基于虹软人脸识别,实现RTMP直播推流追踪视频中所有人脸信息(C#)
前言 大家应该都知道几个很常见的例子,比如在张学友的演唱会,在安检通道检票时,通过人像识别系统成功识别捉了好多在逃人员,被称为逃犯克星:人行横道不遵守交通规则闯红灯的路人被人脸识别系统抓拍放在大屏上以 ...
随机推荐
- PAT1067 试密码 (20分)——测试点4分析 一个易错点
1067 试密码 (20分) 当你试图登录某个系统却忘了密码时,系统一般只会允许你尝试有限多次,当超出允许次数时,账号就会被锁死.本题就请你实现这个小功能. 输入格式: 输入在第一行给出一个密码( ...
- 我一个二本大学是如何拿到阿里offer的
作者:薛勤,互联网从业者,编程爱好者. 本文首发自公众号:代码艺术(ID:onblog)未经许可,不可转载 01:终于步入大学 我既没有跨过山和大海,也没有穿过人山人海,我就是我,一个普通本科大学生. ...
- 集合遍历元素的3种方法:for、foreach、迭代器iterator
1.for循环方式(Set集合不能使用,因为Set是无序的没有索引) for (int i = 0; i < list.size(); i++) { Object o = list.get(i) ...
- UML ——六种依赖关系.md
在UML类图中,常见的有以下几种关系: 泛化(Generalization), 实现(Realization), 关联(Association), 聚合(Aggregation), 组合(Compos ...
- 进程调度函数scheduler_tick()的触发原理:周期PERIODIC定时器
参考文章: https://www.jb51.net/article/133579.htm https://blog.csdn.net/flaoter/article/details/77509553 ...
- Java实现 蓝桥杯 算法训练 Beaver's Calculator
试题 算法训练 Beaver's Calculator 问题描述 从万能词典来的聪明的海狸已经使我们惊讶了一次.他开发了一种新的计算器,他将此命名为"Beaver's Calculator ...
- Java实现 LeetCode 476 数字的补数
476. 数字的补数 给定一个正整数,输出它的补数.补数是对该数的二进制表示取反. 示例 1: 输入: 5 输出: 2 解释: 5 的二进制表示为 101(没有前导零位),其补数为 010.所以你需要 ...
- Java实现蓝桥杯VIP 算法训练 sign函数
问题描述 给定实数x,输出sign(x)的值. sign(x)是符号函数,如果x>0,则返回1:如果x=0,则返回0:如果x<0,则返回-1. 输入格式 一行一个实数x. 输出格式 一行一 ...
- Java实现 LeetCode 239 滑动窗口最大值
239. 滑动窗口最大值 给定一个数组 nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧.你只可以看到在滑动窗口内的 k 个数字.滑动窗口每次只向右移动一位. 返回滑动窗口中的最 ...
- Java实现 LeetCode 127 单词接龙
127. 单词接龙 给定两个单词(beginWord 和 endWord)和一个字典,找到从 beginWord 到 endWord 的最短转换序列的长度.转换需遵循如下规则: 每次转换只能改变一个字 ...