人脸检测及识别python实现系列(1)——配置、获取实时视频流
人脸检测及识别python实现系列(1)——配置、获取实时视频流
1. 前言
今天用多半天的时间把QQ空间里的几篇年前的旧文搬到了这里,算是完成了博客搬家。QQ空间里还剩下一些记录自己数学学习路线的学习日志,属于私人性质,不再搬运了。过完春节,快马加鞭地重修完高阶偏导数后,终于感觉到疲惫了,潜意识里觉得是时候做点东西了,一是练练手,二是换换脑子,用新鲜东西刺激一下自己,好把学习效率保持下去。于是,我选择了自己最感兴趣的人脸识别,期望能够通过摄像头识别出我自己来。正好,前两天济南新闻上说济南火车站可以刷脸进站了,招行也可以刷脸取现了,感情人家都已经大规模商用了,我这儿才刚开始研究,落后啊,继续落后啊。不管它了,知识为我所有、为我所用才是最重要的。别废话了,咱言归正传吧。
说到人脸识别,简单讲就是让程序能够识别出图像的哪个部分是人脸,然后在这个基础上考虑如何应用的问题。像早已冲出国门、走向世界的美图秀秀,以及上面说的刷脸进站、刷脸取现等都是基于人脸识别技术开发出的商用软件产品,而这一切技术的背后都离不开机器学习,更直白的说是离不开数学算法。
我想做的事情是用python写一个小程序,通过读取USB摄像头的视频流识别出我自己来。事情看起来很简单,但实际做起来需要好几个程序协作才能达成目标。首先感谢一个日本程序员,是他提供了实现思路及样例代码,国内有很多Blog和公众号转发了这篇文章,度娘可以搜到,其中一个Blog的链接如下:
度娘能搜到的都与上面相同,千篇一律。我刚开始看到这篇文章的时候很是激动一番,觉得肯定很容易实现了,但实际动手做起来才知道坑很多。作者虽然给了思路和代码,但忽略了很多关键细节,对ML刚入门的同学来说很难实现该文章描述的案例。幸运的是,菜鸟如我,虽然期间跳坑无数,死磕了近1周的时间,我还是爬出了所有的坑,达成了最初的设想,感谢那些为了我的好奇心英勇就义的脑细胞。
这个系列博文的目标不是要取代原博文,而是作为原博文的可操作版,把原博文缺失的细节补上,手把手教会你重现实例。所以,如果你只是想快速了解整个实例,请移步上面给出的链接去看原博文,那篇博文只需花费你几分钟的时间;如果你是个行动派,那就直接参照这个系列博文操练起来,这会花费你半天到几天的时间,请自行斟酌。
2. 准备工作
1)首先需要准备一个USB摄像头,能够支持Ubuntu之类的linux操作系统;
2)PC机上安装好Ubuntu14以上64位版本(尽量双系统不要虚拟机,不然模型训练速度会慢得像蜗牛),可以安装win7/win10,但我没有试过在64位win系统上安装tensorflow,虽然tensorflow已经支持win 64位系统;
3)请确定python3已安装,我给的代码都是在python3下调试通过的,python2只是简单试过,不保证在python2下能正常运行;
4)安装Tensorflow,如果你是独显,且支持CUDA,请安装GPU版本,否则选择CPU版本,我的机器安装的是GPU版本,OS是Ubuntu16.04麒麟,安装Tensorflow的操作说明请问度娘或谷歌,又或者参考本人的另一篇博文:
Google TensorFlow for GPU安装、配置大坑
5)安装opencv2,请安装openCV3.0以上版本(该版本支持python3和python2),参考如下两个链接:
http://www.cnblogs.com/freeweb/p/5794447.html
http://blog.csdn.net/qingyuanluofeng/article/details/51558270
操作指令以第一个链接为准,给第二个的原因是它给出了OpenCV3.0的安装方法,第一个是2.14的且是支持python2的,但第一个给出的指令已经足够用了,第二个博文指令啰嗦,当遇到如何支持python3的问题时供参考用;
6)安装keras、sklearn、PIP等,它们的安装说明网上有的是,也简单,这里就不多说了;
以上准备工作关键是前5步,后面第6步可以暂时不作操作,当执行程序时如果提示某个模块无法导入,再安装该模块也可。
3. 获取并显示USB摄像头实时视频
其实,利用OpenCV获取USB摄像头的视频流并展示出来非常简单,拢共不超过30行代码:
#-*- coding: utf-8 -*- import cv2
import sys
from PIL import Image def CatchUsbVideo(window_name, camera_idx):
cv2.namedWindow(window_name) #视频来源,可以来自一段已存好的视频,也可以直接来自USB摄像头
cap = cv2.VideoCapture(camera_idx) while cap.isOpened():
ok, frame = cap.read() #读取一帧数据
if not ok:
break #显示图像并等待10毫秒按键输入,输入‘q’退出程序
cv2.imshow(window_name, frame)
c = cv2.waitKey(10)
if c & 0xFF == ord('q'):
break #释放摄像头并销毁所有窗口
cap.release()
cv2.destroyAllWindows() if __name__ == '__main__':
if len(sys.argv) != 2:
print("Usage:%s camera_id\r\n" % (sys.argv[0]))
else:
CatchUsbVideo("截取视频流", int(sys.argv[1]))
根本不需要多解释,一看就能明白。接着我们再Shell控制台执行上述代码:

其中,唯一需要解释的就是camera_id,这个就是USB摄像头的索引号,一般是0,如果0不行可以试试1、2等,除非你的摄像头已经坏了,根本不能用。
本着小步快跑,一次一点小成就的原则,系列1到此结束,系列2将会继续——内容为如何利用OpenCV识别出视频中的人脸区域。
人脸检测及识别python实现系列(1)——配置、获取实时视频流的更多相关文章
- 人脸检测及识别python实现系列(2)——识别出人脸
人脸检测及识别python实现系列(2)——识别出人脸 http://www.cnblogs.com/neo-T/p/6430583.html
- 人脸检测及识别python实现系列(6)——终篇:从实时视频流识别出“我”
人脸检测及识别python实现系列(6)——终篇:从实时视频流识别出“我” 终于到了最后一步,激动时刻就要来临了,先平复一下心情,把剩下的代码加上,首先是为Model类增加一个预测函数: #识别人脸 ...
- 人脸检测及识别python实现系列(5)——利用keras库训练人脸识别模型
人脸检测及识别python实现系列(5)——利用keras库训练人脸识别模型 经过前面稍显罗嗦的准备工作,现在,我们终于可以尝试训练我们自己的卷积神经网络模型了.CNN擅长图像处理,keras库的te ...
- 人脸检测及识别python实现系列(4)——卷积神经网络(CNN)入门
人脸检测及识别python实现系列(4)——卷积神经网络(CNN)入门 上篇博文我们准备好了2000张训练数据,接下来的几节我们将详细讲述如何利用这些数据训练我们的识别模型.前面说过,原博文给出的训练 ...
- 人脸检测及识别python实现系列(3)——为模型训练准备人脸数据
人脸检测及识别python实现系列(3)——为模型训练准备人脸数据 机器学习最本质的地方就是基于海量数据统计的学习,说白了,机器学习其实就是在模拟人类儿童的学习行为.举一个简单的例子,成年人并没有主动 ...
- 基于OpenCv的人脸检测、识别系统学习制作笔记之三
1.在windows下编写人脸检测.识别系统.目前已完成:可利用摄像头提取图像,并将人脸检测出来,未进行识别. 2.在linux下进行编译在windows环境下已经能运行的代码. 为此进行了linux ...
- OpenCV 学习笔记 05 人脸检测和识别
本节将介绍 Haar 级联分类器,通过对比分析相邻图像区域来判断给定图像或子图像与已知对象是否匹配. 本章将考虑如何将多个 Haar 级联分类器构成一个层次结构,即一个分类器能识别整体区域(如人脸) ...
- 人工智能之基于face_recognition的人脸检测与识别
不久乘高铁出行,看见高铁火车站已经实现了"刷脸进站",而且效率很高,很感兴趣,今天抽时间研究一下,其实没那么复杂. 我基本上是基于https://github.com/ageitg ...
- 基于Opencv的人脸检测及识别
一.实验目的:我这里完成的是,将8张人脸图片(4组,每组两张)存入库中,选取1张图片,程序识别出与其匹配的另一张. 这里介绍分三个步骤完成该工作,①程序读取摄像头.拍照 ②程序从电脑文档中读取图片 ...
随机推荐
- Freeze partial parameters while training
1. requires_grad = False Set all parameters in the current model frozen: for p in self.parameters(): ...
- 使用mongodb提供的dotnet core sdk进行地理位置运算
mongodb提供地理位置运算功能,比较常用的场景比如,先判断用户所在的街道,然后看看街道附近有啥餐厅,然后算算用户与餐厅的距离什么的,官网里提供了比较详细的demo介绍不同api的用法 此处记录下d ...
- Oracle 表空间、段、区和块简述
数据块(Block) 数据块Block是Oracle存储数据信息的最小单位.注意,这里说的是Oracle环境下的最小单位.Oracle也就是通过数据块来屏蔽不同操作系统存储结构的差异.无论是Windo ...
- 一次tomcat的调优记录
项目本身需要上传模型,使用的是springboot1.5.3. 上传的模型比较大,下载的过程中就出现了问题(下载是su调用的java接口,其开发并非本人负责,不可更改) 问题在于,下载的时候tomca ...
- 小白的Unity5之路(二)镜头平滑跟随角色
这次要完成Camera跟随Player移动, 首先考虑Camera的跟随目标target和平滑移动速度smothing再考虑Camera与Player的偏移量(就是Camera与Player有一个永恒 ...
- 浅谈OSI七层网络模型和TCP/IP四层模型
OSI七层网络模型 OSI(Open System Interconnection)开放系统互连参考模型是国际标准化组织(ISO)制定的一个用于计算机或通信系统间互联的标准体系. OSI七层模型 功能 ...
- 为什么浏览器控制台返回不是undefined,而是一串数字
setTimeout( (function(){console.log("ok")} )(), 16) 在浏览器控制台输入这段代码的时候返回的不是"undefined&q ...
- JSP声明和JSP指令
JSP声明 JSP 声明用来定义程序中使用的实体,如变量.方法和类. 语法格式:<%! 变量/方法/类的声明 %> 例如: <%! String str="欢迎&quo ...
- php 二位数组排序
$member_ship_level 是一个二维数组 $res = array_column($member_ship_level,'integral'); array_multisort($res, ...
- 第二篇:shell基础命令(部分)
目录 一.shell命令规则 二.基础命令详解(部分) ls :列出目录内容 mkdir : 创建目录 rmdir :删除目录 touch:新建文件 mv:修改文件(目录)名.移动路径 cp:复制文件 ...