RNetFastRCNN你都掌握了吗?一文总结目标检测必备经
欢迎关注计算机视觉研究院
计算机视觉研究院专栏
作者:EdisonG
微信公众号:计算机视觉研究院
转自《机器之心》
本文将分3期进行连载,共介绍16个在目标检测任务上曾取得SOTA的经典模型。
第1期:RCNN、SPPNet、FastRCNN、FasterRCNN、OHEM
第2期:RFCN、MaskRCNN、YoLo、SSD、FPN、RetinaNet第3期:RRCdetection、CornerNet、M2Det、FOCS、ObjectBox
您正在阅读的是其中的第1期。前往SOTA!模型资源站(sota。jiqizhixin。com)即可获取本文中包含的模型实现代码、预训练模型及API等资源。
本期收录模型速览
模型SOTA!模型资源站收录情况模型来源论文RCNNhttps:sota。jiqizhixin。comprojectrcnn2
收录实现数量:2
支持框架:MindSpore
RichfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentationSPPNethttps:sota。jiqizhixin。comprojectsppnet
收录实现数量:3
支持框架:PyTorch,MindSpore等
SpatialPyramidPoolinginDeepConvolutionalNetworksforVisualRecognitionFastRCNNhttps:sota。jiqizhixin。comprojectfastrcnn2
收录实现数量:27
支持框架:PyTorch,TensorFlow等
FastRCNNFasterRCNNhttps:sota。jiqizhixin。comprojectfasterrcnn2
收录实现数量:16
支持框架:PyTorch,TensorFlow等FasterRCNN:TowardsRealTimeObjectDetectionwithRegionProposalNetworksOHEMhttps:sota。jiqizhixin。comprojectohem
收录实现数量:5
支持框架:PyTorch,TensorFlowTrainingRegionbasedObjectDetectorswithOnlineHardExampleMining
本文回顾目标检测中必备的TOP模型,包括onestage模型和twostage模型。
一、twostage模型
图1。RCNN目标检测系统概览
图2。一个带有空间金字塔池层的网络结构。这里256是conv5层的过滤器编号,conv5是最后一个卷积层
图3。FastRCNN架构。将一个输入图像和多个感兴趣的区域(RoI)输入到一个全卷积网络。每个ROI汇集成一个固定大小的特征图,然后通过全连接层(FCs)映射成一个特征向量。该网络对每个RoI有两个输出向量:softmax概率和每类boundingbox回归偏移。该架构采用多任务损失法进行端到端训练
图4。RPN结构
图5。FasterRCNN是一个用于物体检测的单一、统一的网络。RPN模块作为这个统一网络的注意力
图6。OHEM训练过程,给定一个图像和选择性搜索的RoI,conv网络计算出一个conv特征图。在(a)中,只读RoI网络对特征图和所有RoI(绿色箭头所示)进行前向传递。然后,HardRoI模块使用这些RoI损失来选择B个样本。在(b)中,这些hard样本被RoI网络用来计算前向和后向传递(红色箭头所示)
THEEND
转载请联系本公众号获得授权计算机视觉研究院学习群等你加入!
计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重研究。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
计算机视觉研究院公众号IDComputerVisionGzq