网络细节资料很多,不做赘述,主要总结演化思路和解决问题. 一.YOLO 1.网络简介 YOLO网络结构由24个卷积层与2个全连接层构成,网络入口为448x448(v2为416x416),图片进入网络先经过resize,输出格式为: 其中,S为划分网格数,B为每个网格负责目标个数,C为类别个数.B表示每个小格对应B组可能的框,5表示每个框的四个坐标和一个置信度,C表示类别,同时也说明B个框只能隶属于同一个类别. 2.损失函数 损失函数有四部分组成, 上文中的红圈符号表示是否开关,比如第一个符号表示