应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

用于精确目标检测的多网格冗余边界框标注

  关注并星标
  从此不迷路计算机视觉研究院
  公众号IDComputerVisionGzq
  论文地址:https:arxiv。orgpdf2201。01857。pdf计算机视觉研究院专栏
  作者:EdisonG现在领先的目标检测器是从基于深度CNN的主干分类器网络重新调整用途的两级或单级网络。
  一、前言
  现在领先的目标检测器是从基于深度CNN的主干分类器网络重新调整用途的两级或单级网络。YOLOv3就是这样一种众所周知的最先进的单级检测器,它接收输入图像并将其划分为大小相等的网格矩阵。具有目标中心的网格单元负责检测特定目标。
  今天分享的,就是提出了一种新的数学方法,该方法为每个目标分配多个网格,以实现精确的tightfit边界框预测。研究者还提出了一种有效的离线复制粘贴数据增强来进行目标检测。新提出的方法显着优于一些当前最先进的目标检测器,并有望获得更好的性能。
  二、背景
  目标检测网络旨在使用紧密匹配的矩形边界框在图像上定位对象并正确标记它。如今,有两种不同的方法可以实现这一目的。第一个也是性能方面,最主要的方法是两阶段目标检测,最好的代表RCNN及其衍生物〔Fasterrcnn:Towardsrealtimeobjectdetectionwithregionproposalnetworks〕、〔Fastrcnn〕。相比之下,第二组目标检测实现因其出色的检测速度和轻量级而广为人知,被称为单阶段网络,代表性示例为〔Youonlylookonce:Unified,realtimeobjectdetection〕、〔Ssd:Singleshotmultiboxdetector〕、〔Focallossfordenseobjectdetection〕。两阶段网络依赖于一个潜在的区域建议网络,该网络生成可能包含感兴趣对象的图像的候选区域,第二个检测头处理分类和边界框回归。在单阶段目标检测中,检测是一个单一的、完全统一的回归问题,它在一个完整的前向传递中同时处理分类和定位。因此,通常,单阶段网络更轻、更快且易于实现。
  今天的研究依然是坚持YOLO的方法,特别是YOLOv3,并提出了一种简单的hack,可以同时使多个网格单元预测目标坐标、类别和目标置信度。每个对象的多网格单元分配背后的基本理论是通过强制多个单元在同一对象上工作来增加预测紧密拟合边界框的可能性。
  多网格分配的一些优点包括:
  (a)为目标检测器提供它正在检测的对象的多视角视图,而不是仅依靠一个网格单元来预测对象的类别和坐标;
  (b)较少随机和不稳定的边界框预测,这意味着高精度和召回率,因为附近的网格单元被训练来预测相同的目标类别和坐标;
  (c)减少具有感兴趣对象的网格单元与没有感兴趣对象的网格之间的不平衡。
  此外,由于多网格分配是对现有参数的数学利用,并且不需要额外的关键点池化层和后处理来将关键点重新组合到其对应的目标,如CenterNet和CornerNet,可以说它是一个更实现无锚或基于关键点的目标检测器试图实现的自然方式。除了多网格冗余注释,研究者还引入了一种新的基于离线复制粘贴的数据增强技术,用于准确的目标检测。
  三、MULTIGRIDASSIGNMENT
  上图包含三个目标,即狗、自行车和汽车。为简洁起见,我们将解释我们在一个对象上的多网格分配。上图显示了三个对象的边界框,其中包含更多关于狗的边界框的细节。下图显示了上图的缩小区域,重点是狗的边界框中心。包含狗边界框中心的网格单元的左上角坐标用数字0标记,而包含中心的网格周围的其他八个网格单元的标签从1到8。
  到目前为止,我已经解释了包含目标边界框中心的网格如何注释目标的基本事实。这种对每个对象仅一个网格单元的依赖来完成预测类别的困难工作和精确的tightfit边界框引发了许多问题,例如:
  (a)正负网格之间的巨大不平衡,即有和没有对象中心的网格坐标
  (b)缓慢的边界框收敛到GT
  (c)缺乏要预测的对象的多视角(角度)视图。
  所以这里要问的一个自然问题是,显然,大多数对象包含一个以上网格单元的区域,因此是否有一种简单的数学方法来分配更多这些网格单元来尝试预测对象的类别和坐标连同中心网格单元?。这样做的一些优点是(a)减少不平衡,(b)更快的训练以收敛到边界框,因为现在多个网格单元同时针对同一个对象,(c)增加预测tightfit边界框的机会(d)为YOLOv3等基于网格的检测器提供多视角视图,而不是对象的单点视图。新提出的多重网格分配试图回答上述问题。
  Groundtruthencoding四、训练
  A。TheDetectionNetwork:MultiGridDet
  MultiGridDet是一个目标检测网络,通过从YOLOv3中删除六个darknet卷积块来使其更轻、更快。一个卷积块有一个Conv2DBatchNormalizationLeakyRelu。移除的块不是来自分类主干,即Darknet53。相反,将它们从三个多尺度检测输出网络或头中删除,每个输出网络两个。尽管通常深度网络表现良好,但太深的网络也往往会快速过度拟合或大幅降低网络速度。
  B。TheLossfunction
  Coordinateactivationfunctionplotwithdifferentvalues
  C。DataAugmentation
  离线复制粘贴人工训练图像合成工作如下:首先,使用简单的图像搜索脚本,使用地标、雨、森林等关键字从谷歌图像下载数千张背景无对象图像,即没有我们感兴趣的对象的图像。然后,我们从整个训练数据集的随机q个图像中迭代地选择p个对象及其边界框。然后,我们生成使用它们的索引作为ID选择的p个边界框的所有可能组合。从组合集合中,我们选择满足以下两个条件的边界框子集:
  ifarrangedinsomerandomordersidebyside,theymustfitwithinagiventargetbackgroundimagearea
  andshouldefficientlyutilizethebackgroundimagespaceinitsentiretyoratleastmostpartofitwithouttheobjectsoverlap。五、实验及可视化
  PascalVOC2007上的性能比较
  coco数据集上的性能比较
  从图中可以看出,第一行显示了六个输入图像,而第二行显示了网络在非极大抑制(NMS)之前的预测,最后一行显示了MultiGridDet在NMS之后对输入图像的最终边界框预测。TheEnding
  转载请联系本公众号获得授权计算机视觉研究院学习群等你加入!
  计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重研究。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
  计算机视觉研究院公众号IDComputerVisionGzq

机械海绵宝宝通关攻略通关攻略机械海绵宝宝通关攻略:在上一关打败机械派大星的时候,来到泡泡人这里,这时会解锁巡航泡泡技能。这个技能在打机械海绵宝宝的时候非常实用。接着我们来到海之霸餐厅里的实验室,在这……客来有酒,狼来有枪浅评韩媒北京再次将其排除据韩联社报道:北京再次将韩国排除在团队旅游目的地之外,中国公布了第二批恢复出境团队旅游的国家名单,但韩国未入围,这被广泛视为(中国对韩国的)某种政治抱怨。读完此新闻,一是……追涨杀跌一番操作收益损耗近60!专家支招基民如何理性投资近年来,基金赚钱基民不赚钱是始终困扰投资者的怪现象。3月17日,来自清华大学金融科技研究院的报告显示,选品、配置、长期持有是大众投资者在理财时自发形成的健康行为。同一风险等级用……不妥协的allinone简评山灵EC3多功能CD一体机山灵的CD机,是一个我非常信得过的品类。去年在搭建自己的耳机系统时,经过多伦轮选择,我暂时确定了山灵CD1。2A作为CD转盘,它不仅拥有着优秀的数字输出素质,还配备了PC……广州动物园大熊猫憨态可掬来源:中国新闻网4月10日,广东广州,广州动物园大熊猫星一吃竹子,憨态可掬。4月10日,广东广州,广州动物园的大熊猫雅一吃南瓜,憨态可掬。4月10日,广东广州……帕米尔高原迎来环塔专列旅游团4月11日帕米尔高原上的塔什库尔干塔吉克自治县石头城景区盛装的塔吉克族群众跳着欢快的舞蹈欢迎环塔专列旅游团光临4月11日,在塔什库尔干塔吉克自治县石头城……分享2种小龙虾的做法,不要怕麻烦,避免寄生虫,好吃又放心头条创作挑战赛这几天海鲜市场的小龙虾可以说是头牌,每次去小龙虾摊位都围满了人,挤都挤不进去,其实倒也不难理解,这个时候的小龙虾最是鲜嫩肉多的,品质高的话能卖到120元左右……挖鼻孔看似无害,实则暗藏诸多隐患近日,外媒报道,过度挖鼻孔或造成细菌性脑膜炎等疾病。此前,也有媒体报道,深圳一名8岁男童平时喜欢挖鼻孔,有时候会挖得流鼻血。一开始家里人没有太在意,后来才发现孩子鼻腔里长了一个……恩佐世界杯面对逆境我们展示了个性我会为赢得一切而战直播吧4月10日讯在接受欧足联官方采访时,切尔西中场恩佐费尔南德斯谈到了与阿根廷一起赢得世界杯以及加盟蓝军等话题。关于与阿根廷一起赢得世界杯恩佐:阿根廷在多年后赢得……从世界杯8强,看国际语言要说最近大家最关心的事情之一,莫过于如火如荼举行的2022卡塔尔世界杯,是历史上首次在卡塔尔和中东国家境内举行、也是第二次在亚洲举行的世界杯足球赛,多少球民熬夜只为了一球欢呼!……早起不刷牙就喝水,等于喝细菌?一文为你揭晓答案,别喝错如今人们的养生意识越来越强,而且我们睡了一晚上觉,早上起床之后总是感觉口干舌燥,这个时候起床之后立马喝一杯温开水,可以达到解渴的效果,也可以达到润肠道的效果。然而有人说我……新机1。5K屏vivoS17Pro配置曝光骁龙778G和天玑去年12月,vivo发布了S16系列,近日vivoS17系列部分信息也被曝光了。数码闲聊站爆料称vivoS17将搭载SM7325处理器(预计为骁龙778G?),vivoS……
大声疾呼醒醒吧!别再让原生家庭论祸害你全家作者:赵小明编辑排版:崔贯利在英语中,look和see是不同的,学会区分看与看到、看与观察,并尝试从不同视角去See是非常重要的。西方教育的主要目标就是教会学生学会……被禁赛的孙杨转行当主播,带货成绩亮眼,成当晚带货榜单冠军孙杨是泳坛名将,如果孙杨没被禁赛,那么很有可能,他的成就会超越美国飞鱼菲尔普斯,可是孙杨在面临8年禁赛,也就是说他未来将很长一段时间不会再出现在泳坛中。而孙杨也鲜少出现在公众面……走马上任!孙颖莎教练陈玘走上新岗位,薪资曝光,刘国梁没看错人说到孙颖莎、陈玘、刘国梁相信球迷朋友不陌生,他们都是国乒的名人。孙颖莎是如今的女乒领军人物,和陈梦、王曼昱形成了三足鼎立之势,同时也是巴黎奥运会的主打人物。一点也不夸张地说孙颖……江南春光美,诗中的江南春美如画江南是一个诗情画意的地方,很多人向往。江南的春天,柳绿花红,烟雨蒙蒙,处处都是美景,令人心醉。不知道是不是读书时代,看太多琼瑶剧和某位皇帝下江南的电视剧。从那时起,我就深……美媒发布最新mvp榜约基奇力压恩比德高居第一,塔图姆升入前五随着常规赛临近尾声,关于MVP归属的讨论变得愈发激烈。近日,ESPN名记TimBontemps针对mvp搞了本赛季最后一次投票调查,最终结果显示,约基奇力压恩比德高居榜首,太阳……体内湿气太重怎么办?学好这4个祛湿方法,身体会舒服些由于现在生活工作压力大,饮食上不规律,人们存在着很多不良习惯,久而久之就会使身体上湿气过重,但是现在很多人不知道体内湿气重是什么样子,从而致使自己没有及时调理身体,使体内湿气积……前国脚热身赛时疑将中华烟带到场边!媒体人痛批中国足球没救了在结束了12强赛之后,中国足球陷入了一波平静,各支球队也进入了新赛季的备战期。但北京时间4月10日晚,媒体人李平康在社交账号上晒出了一张照片,却再度引发了中国球迷热议。照……英格丽褒曼从瑞典孤儿到三获奥斯卡的传奇人生好莱坞的黄金时代涌现出许多才华横溢的女演员,英格丽褒曼就是其中一个真正的传奇。伯格曼出生于瑞典斯德哥尔摩,后来出演了许多经典电影,如《卡萨布兰卡》、《圣玛丽的钟声》、《圣女贞德……圆明园焚毁后难复原,被毁150多年后,废墟中竟发掘出5万余件即使把我国所有博物馆的全部宝物加在一起,也不能同这个规模宏大而富丽堂皇的东方博物馆媲美。法国大作家雨果前言圆明园作为清朝的皇家园林,毫无疑问是世界建筑史上一颗璀璨的……匿名者对俄宣战揭秘神秘黑客组织匿名者据俄罗斯卫星社25日消息,黑客组织匿名者(Anonymous)在社交媒体发表声明称,宣布发起对俄罗斯的网络战争并对攻击俄罗斯RT电视台网站一事负责。声明称:Anonymous正……东北农村小伙娶1。97米女篮巨人,公婆很喜欢,还为她拆掉房门提到姚明,想必不少人都会第一时间在脑海中浮现出他那巨人般的身高。确实,由于篮球这项运动中对于身高的要求较高,导致大部分篮球运动员都是高个子的巨人,包括屡屡为国争光的女篮当……2个中成药,益气补心以活血化瘀通络以行血,改善冠心病中风气虚血瘀,是冠心病、中风等发病的重要病理基础,同时也是发生发展的重要因素。因此,中医治疗冠心病、中风既要益气补心以活血,又要活血化瘀以行血。临证时要抓住虚则补心、瘀则化之的治疗……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网