YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级在本次升级中 飞桨工程师本着精益求精的工匠精神 使该模型得到了进一步强化 COCO 数据集 mAP 高达 43 2 训练速度也提升了 40 并基于 YOLOv3 开源了多种模型压缩完整方案 使 YOLOv3 更上一层楼

大家好,欢迎来到IT知识分享网。

欢迎关注“视学算法”

喜欢看科幻电影的朋友一定会对这样的画面印象深刻:钢铁侠去解救被恐怖分子挟持的人质时,他的战衣可以快速的从人群之中识别持有武器的恐怖分子,并确定恐怖分子的位置,然后一阵火花带闪电就问题解决了,岂是一个“帅”字可以形容!从发现敌人到发动攻击不超过5秒种,可谓战衣在手,天下我有!令科幻迷们大喊一声:“这样的战衣给我来一打!”

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

在基于COCO数据集的测试中,骨干网络DarkNet作者在其论文中所使用的YOLOv3模型的验证精度mAP为33.0%,而飞桨在之前版本中曾经发布过基于DarkNet53的YOLOv3模型,该模型的验证精度为mAP 38.9%。飞桨又做了如下改进,使得验证精度mAP再次提高到43.2%,并且推理速度提升21%。本次升级还对数据预处理速度持续优化,使得整体训练速度提升40%。

  • 骨干网络更换为ResNet50-VD类型。ResNet50-VD网络相比升级前的DarkNet53网络,在速度和精度上都有一定的优势,且相较于DarkNet53网络,ResNet系列更容易扩展,用户可以针对自己业务场景的特点,灵活选择ResNet18、34、101等不同网络类型作为模型的骨干网络。
  • 引入Deformable Convolution v2(简称DCNv2,可变形卷积)替代原始卷积操作。DCNv2已经在多个视觉任务中广泛验证过其效果,在考虑到速度与精度平衡的前提条件下,本次升级的YOLOv3模型使用DCNv2替换了主干网络中stage5部分的3×3卷积。实验数据表明,使用ResNet50-VD和DCVv2后,模型精度提升了0.2%,提速约为21%。
  • 在FPN部分增加DropBlock模块,提高了模型泛化能力。DropBlock算法相比于Dropout算法,在Drop特征的时候会集中Drop掉某一块区域,更适合应用到检测任务中来提高网络的泛化能力。
YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

图3 Dropout和Dropblock对比图

  • YOLOv3作为一阶段检测网络,在定位精度上相比Faster RCNN、Cascade RCNN等网络结构有着其天然的劣势,增加IoU Loss分支,可以一定程度上提高边界框的定位精度,缩小一阶段和两阶段检测网络的差距。
  • 使用Objects365数据集训练得到的模型作为COCO数据集上的预训练模型。Objects365数据集包含约60万张图片、365种类别,高达1000万框数,与COCO数据集相比,Objects365数据集具有5倍的图像数量、4倍的类别数量、以及10倍以上标注框数量,可以进一步提高YOLOv3预训练模型的精度。
YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

人脸检测模型BlazeFace压缩3倍,提速122%


YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

图4 BlazeFace的NAS版本硬件延时搜索过程

新增IoU损失函数,精度再提升1%,不增加预测耗时


新增基于COCO数据集的精度最高开源模型CBNet,高达53.3%


新增CBNet模型,该模型是对已有的结构进行联结,生成新的骨干网络,以ResNet结构为例,级联个数为2时,称为Dual-ResNet,级联个数为3时,称为Triple-ResNet。本次新增的CBNet基础模型使用的是AHLC(Adjacent Higher Level Composition)组网方式,在论文中的几种组网联结方式中性能最好。此外除了新增基础模型外,还发布了单尺度检测模型
CascadeRCNN-CBR200-vd-FPN-dcnv2-nonlocal,该模型在经过COCO val2017验证集验证后,其精度高达53.3%。

新增Libra-RCNN模型,精度提升2%

新增的Libra R-CNN模型。检测模型训练大多包含候选区域生成与选择、特征提取、类别分类和检测框回归等多个任务的训练与收敛。在两阶段目标检测任务中存在样本(sample level)、特征(feature level)以及目标级别(objective level)三个层面的不均衡现象,这些不均衡现象会限制模型的性能。LibraR-CNN模型从这三个层面分别进行了优化。最终与FasterRCNN-ResNet50vd-FPN相比,在COCO两阶段目标检测任务中,LibraR-CNN模型精度超出2%,效果十分明显。

新增Open Images V5目标检测比赛最佳单模型

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

PaddleSlim助力PaddleDetection,化学反应,势不可挡!


目标检测模型在实际部署时,由于耗时和内存占用,仍然存在很大挑战。模型压缩通常是解决速度和内存占用的有效手段。飞桨框架的压缩工具PaddleSlim提供了多种非常有效的模型压缩方法,推动PaddleDetection性能达到新高度。

使用蒸馏模型压缩方案提升验证精度2%

模型蒸馏是将复杂网络中的有用信息提取出来,迁移到一个更小的网络中去,从而达到节省计算资源的目的。通过蒸馏实验可以发现同一种蒸馏方法不一定适用所有数据集,由于Pascal VOC和COCO数据集的任务难度不同,PaddleDetection对YOLOv3模型在PascalVOC和COCO数据采用了不同的蒸馏方案,实验表明,蒸馏后的MobileNet-YOLOv3模型在Pascal VOC数据集上,验证集精度mAP 提高了2.8%,在COCO数据集上,验证集精度mAP提高了2.1%。

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

使用裁剪模型压缩方案大幅降低FLOPs

裁剪策略可以通过分析各卷积层的敏感度得到各卷积核的适宜裁剪率,通过裁剪卷积层通道数来减少卷积层中卷积核的数量,实现减小模型体积,降低模型计算复杂度的作用。实验表明以ResNet50vd-dcn-YOLOv3为例,在COCO数据集上FLOPS降低了8.4%,mAP提高了0.7%;MobileNet-YOLOv3在COCO数据集上FLOPS降低了28.54%,mAP提高了0.9%;在Pascal VOC数据集上FLOPs降低了69.57%,mAP提高了1.4%。

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级


目前PaddleDetection已在武汉精测电子工业质检、创赢科技垃圾分类项目、南方电网指针类表计读数解决方案、电网巡检等多个项目中得到了实际应用,且取得了良好的效果。

YOLOv3精度再次提高4.3%,训练提速40%!PaddleDetection全面升级

图6 电网巡检方案效果图

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/180118.html

(0)
上一篇 2025-06-06 09:00
下一篇 2025-06-06 09:15

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信