YOLO-v4 口罩识别

一、YOLO-v4概念

如果想要了解和认识yolo-v4的基本概念,首先要提的就是它的基础版本yolo-v1,对于yolo来说,最经典的算是yolo-v3。如果想要了解它的由来和历史的话,可以自行搜索。那么接下来,就先从yolo-v1入手各方面来介绍对比一下yolo-v4。

1、yolo-v1结构设计

原论文地址:https://tuzishenshi.lanzoui.com/iMMu2s92w4f

图1、网络结构图

yolov1网络结构图是由24个卷积层、2个全连接层构成,其作者也说过灵感来自用于图像分类的GoogLeNet模型,但是与GoogLeNet模型不同的是简单的使用了1×1简化层和3×3卷积层(类似M. Lin, Q. Chen, and S. Y an. Network in network. CoRR,abs/1312.4400, 2013. 2),可以在上图看到。

输入的图像为448448,经过以上的结构,输出的为77*1024的张量,是第7个图样。在激活函数上,最后一层输出时用了线性激活函数,其余层都使用的是Leaky Relu激活函数。

图2、Leaky Relu激活函数

YOLO相对于其他的(例如rcnn、fast-rcnn、faster-rcnn等)来说,它的优势就是YOLO设计实现了端到端的培训和实时速度,同时保持了较高的平均精度。具体的话就是将目标检测的各个部分统一为一个单一的神经网络,网络使用整个图像的特征来预测每个边界框。它还可以同时预测图像中所有类的所有边框。这意味着我们的网络对完整的图像和图像中的所有对象进行全局推理。

2、yolo-v1损失函数

图3、损失函数

3、yolo-v1和yolo-v4对比

yolo-v4说简单点就是对yolo-v3的改进,它的改进方法就是总结了几乎所有的检测技巧,又提出一点儿技巧,然后经过筛选,排列组合,挨个实验(ablation study)哪些方法有效。YOLOv4对深度学习中一些常用Tricks进行了大量的测试,最终选择了这些有用的Tricks:WRC、CSP、CmBN、SAT、 Mish activation、Mosaic data augmentation、CmBN、DropBlock regularization 和 CIoU loss。

YOLOv4在传统的YOLO基础上,加入了这些实用的技巧,实现了检测速度和精度的最佳权衡。实验表明,在Tesla V100上,对MS COCO数据集的实时检测速度达到65 FPS,精度达到43.5%AP。

二、yolo-v4源码

这个是从网络收集而来,自己已经跑通了,里面也有一些使用的方法,也就不啰嗦了,可以自己研究一下,跑一下口罩识别。

链接地址: https://pan.baidu.com/s/1ziNPRznNcfdGMCKWtB4xYQ 提取码: e939

三、口罩数据

我这里整理了一些数据集,一共有三个、我跑的是yolov4的第二个数据集。我会标注,可以先用我跑的这个,因为我跑通了。

链接地址:https://pan.baidu.com/s/1G1XLjK8Y3WNbRSf-1dwVgA 提取码: vvhv

四、处理数据

1、批量移动(删除)某格式的文件【父目录下所有文件】

 1 import os
2 import shutil
3
4 for parent, dirnames, filenames in os.walk('原目录'):
5 for fn in filenames:
6
7 if fn.lower().endswith('.xml'):
8 # os.remove(os.path.join(parent, fn)) ##这是删除文件的语句
9 shutil.copy(os.path.join(parent, fn),'目标目录') #这是移动的语句
10
11 #目录例子 D:\\学习文件\\YOLO\\数据\\xml (注意:双斜杠)

2、批量更改目录下某格式文件的名字【父目录下所有文件】

 1 import os
2
3
4 class BatchRenamePics(object):
5 """
6 批量命名目录下的所有图名[.jpg,.png]
7 命名格式:1-1,1-2...2-1,2-2...10-1,10-2...eg
8 """
9 def __init__(self, path):
10 # 设置起始路径path
11 self.path = path
12
13 def rename(self):
14 allfile = os.walk(self.path)
15 # j用于计数,统计有多少张照片被重命名
16 j = 0
17 # 遍历每一层目录,从上到下的顺序
18 for dirpath, dirnames, filenames, in allfile:
19 # 得到当前文件夹的名字tail
20 tail = os.path.split(dirpath)[1]
21 # i用于命名
22 i = 0
23 # 遍历filenames中的每一个文件
24 for each in filenames:
25 # 如果文件名是以.jpg或者.png结尾则认为是图片,可以自己添加其他格式的照片
26 if each.endswith('.jpg') or each.endswith('.png')or each.endswith('.xml'):
27 i += 1
28 j += 1
29 # 拼接完整的包含路径的文件名
30 scr = os.path.join(dirpath, each)
31 # 拼接新的完整的包含路径的文件名, tail是文件夹的名字
32 # dst = os.path.join(dirpath, tail + '-' + str(i) + '.jpg') ##这个是文件改格式
33 dst = os.path.join(dirpath, str(j) + '.jpg')
34 try:
35 # 重命名图片文件
36 os.rename(scr, dst)
37 print(scr + '--->' + dst)
38 except:
39 continue
40 else:
41 continue
42 print('累计重命名{}张图片'.format(j))
43
44 if __name__ == '__main__':
45 # 设置起始路径path
46 path = r'原目录'
47 # 创建实例对象
48 pics = BatchRenamePics(path)
49 # 调用实例方法
50 pics.rename()

最后,感谢大家对本文章的阅读,如果有什么问题,欢迎在下方留言,一起讨论,共同进步。

YOLO-v4 口罩识别的更多相关文章

  1. YOLO v1到YOLO v4(下)

    YOLO v1到YOLO v4(下) Faster YOLO使用的是GoogleLeNet,比VGG-16快,YOLO完成一次前向过程只用8.52 billion 运算,而VGG-16要30.69bi ...

  2. YOLO v1到YOLO v4(上)

    YOLO v1到YOLO v4(上) 一.  YOLO v1 这是继RCNN,fast-RCNN和faster-RCNN之后,rbg(RossGirshick)针对DL目标检测速度问题提出的另外一种框 ...

  3. YOLO V4 :win10+cpu环境的体验

    1.前言 Yolo V3已经体验了,接下来是V4版本. 关于V4版本,学术界褒贬不一.从工业界实际应用角度看,V4做了不少的优化,精度提升了10%,速度提升了12%.详细参见: <如何评价新出的 ...

  4. YOLO-V4 实现口罩识别(附加数据、数据批量处理程序)

    一.YOLO-v4概念 如果想要了解和认识yolo-v4的基本概念,首先要提的就是它的基础版本yolo-v1,对于yolo来说,最经典的算是yolo-v3.如果想要了解它的由来和历史的话,可以自行搜索 ...

  5. YOLO v4分析

    YOLO v4分析 YOLO v4 的作者共有三位:Alexey Bochkovskiy.Chien-Yao Wang 和 Hong-Yuan Mark Liao.其中一作 Alexey Bochko ...

  6. 目标检测中特征融合技术(YOLO v4)(下)

    目标检测中特征融合技术(YOLO v4)(下) ASFF:自适应特征融合方式 ASFF来自论文:<Learning Spatial Fusion for Single-Shot Object D ...

  7. 目标检测中特征融合技术(YOLO v4)(上)

    目标检测中特征融合技术(YOLO v4)(上) 论文链接:https://arxiv.org/abs/1612.03144 Feature Pyramid Networks for Object De ...

  8. YOLO V4的模型训练

    1.YOLO V4模型训练的基本思路 所有机器学习涉及模型训练,一般都有训练集.验证集.测试集,因此需要准备数据集.有了数据集,再调用训练的算法,获取训练的结果.v3.v4模型训练方法相同. 2.YO ...

  9. darknet53 yolo 下的识别训练

    [目录] 一. 安装Darknet(仅CPU下) 2 1.1在CPU下安装Darknet方式 2 1.2在GPU下安装Darknet方式 4 二. YOLO.V3训练官网数据集(VOC数据集/COCO ...

随机推荐

  1. VBS脚本编程(2)——运算符

    算数运算符 用于执行数学计算的运算符. 1.加法运算符( + ) 计算两个数之和. 2.减法运算符( - ) 计算两个数值的差或表示数值表达式的负值. 3.乘法运算符(*) 计算两个数之积. 4.除法 ...

  2. 基于Redis的分布式锁设计

    前言 基于Redis的分布式锁实现,原理很简单嘛:检测一下Key是否存在,不存在则Set Key,加锁成功,存在则加锁失败.对吗?这么简单吗? 如果你真这么想,那么你真的需要好好听我讲一下了.接下来, ...

  3. Network:java中文转byte出现负数问题

    字节的释义 字节(Byte) 是计算机信息技术用于计量存储容量的一种计量单位,通常情况下 1字节 = 8位(bit),也表示一些计算机编程语言中的数据类型和语言字符. 字符与字节 ASCII码:1个英 ...

  4. Python中的json学习

    p.p1 { margin: 0; font: 14px ".PingFang SC"; color: rgba(53, 53, 53, 1) } p.p2 { margin: 0 ...

  5. Linux学习之路(RPM和YUM)

    rpm包的管理 介绍: 一种用于互联网下载包的打包及安装工具(类似windows中的setup).它包含在某些Linux分发版中.它生成具有RPM扩展名的文件.RPM是RedHat软件包管理工具缩写, ...

  6. 跨域解决之JSONP和CORS的详细介绍

    JSONP跨域和CORS跨域 什么是跨域? 跨域:指的是浏览器不能执行其它网站的脚本,它是由浏览器的同源策略造成的,是浏览器的安全限制! 同源策略 同源策略:域名.协议.端口均相同. 浏览器执行Jav ...

  7. C#下通过wbemtest和WMI Code Cretor更加高效的访问WMI

    能找到这篇博客的,相信都是有操作WMI需求的了.但是不知道如何快速验证.并集成到C#来操作WMI.我们分为3步: ##第一步:官网(或跟硬件开发WMI的人沟通你需要的接口和参数定义,如果是和硬件开发的 ...

  8. [网络流24题]最长k可重区间集[题解]

    最长 \(k\) 可重区间集 题目大意 给定实心直线 \(L\) 上 \(n\) 个开区间组成的集合 \(I\) ,和一个正整数 \(k\) ,试设计一个算法,从开区间集合 \(I\) 中选取开区间集 ...

  9. python02篇 字典、元组、切片

    一.字典 1.1 字典的常用方法 # 字典 数据类型 {} key-value # list是挨个循环查找,字典是根据key查找value,比list遍历效率高 d = { 'username': ' ...

  10. PYTHON找色不变移动

    import cv2 import aircv as ac import numpy as np def wmhd(sjh): bzz0=0 bzz1=0 bzz2=0 xxa=0 yya=0 xxb ...