【目标监测】CenterNet原理详解

大家好，欢迎来到IT知识分享网。

enterNet是在2019年论文Objects as points中提出，相比yolo，ssd，faster_rcnn依靠大量anchor的检测网络，CenterNet是一种anchor-free的目标检测网络，在速度和精度上都比较有优势，值得学习下。

对于CenterNet的理解主要在于四方面：网络结构，heatmap生成，数据增强，loss函数理解。

CenterNet网络结构
　　除了检测任务外，CenterNet还可以用于肢体识别或者3D目标检测等，因此CenterNet论文中提出了三种backbone的网络结构，分别是Resnet-18， DLA-34和Hourglass-104, 三种backbone准确度和速度如下：

Resnet-18 with up-convolutional layers : 28.1% coco and 142 FPS

DLA-34 : 37.4% COCOAP and 52 FPS

Hourglass-104 : 45.1% COCOAP and 1.4 FPS

CenterNet网络比较简单，主要包括resnet50提取图片特征，然后是反卷积模块Deconv(三个反卷积)对特征图进行上采样，最后三个分支卷积网络用来预测heatmap, 目标的宽高和目标的中心点坐标。值得注意的是反卷积模块，其包括三个反卷积组，每个组都包括一个3*3的卷积和一个反卷积，每次反卷积都会将特征图尺寸放大一倍，有很多代码中会将反卷积前的3×3的卷积替换为DCNv2(Deformable ConvetNets V2)来提高模型拟合能力。

关于DCN(Deformable ConvetNets)参见：https://zhuanlan.zhihu.com/p/， https://zhuanlan.zhihu.com/p/

CenterNet的模型计算流程如下：

图片缩放到512×512尺寸(长边缩放到512，短边补0)，随后将缩放后1x3x512x512的图片输入网络

图片经过resnet50提取特征得到feature1尺寸为1x2048x16x16

feature1经过反卷积模块Deconv，三次上采样得到feature2尺寸为1x64x128x128

将feature2分别送入三个分支进行预测，预测heatmap尺寸为1x80x128x128(表示80个类别)，预测长宽尺寸为1x2x128x128(2表示长和宽)，预测中心点偏移量尺寸为1x2x128x128(2表示x, y)

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/125221.html

【目标监测】CenterNet原理详解

相关推荐

发表回复