应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

AnchorFree目标检测器EdgeYOLO精度和速度完美

  作者丨小书童
  来源丨集智书童
  编辑丨极市平台
  本文提出了一种基于最先进YOLO框架的高效、低复杂度和AnchorFree的目标检测器,该检测器可以在边缘计算平台上实时实现。本文开发了一种增强的数据增强方法,以有效抑制训练过程中的过拟合问题,并设计了一种混合随机损失函数,以提高小目标的检测精度。受FCOS的启发,提出了一种更轻、更有效的DecoupledHead,其推理速度得到了提高,精度损失很小。本文的基线模型在MSCOCO2017数据集中可以达到50。6AP50:95和69。8AP50的精度,在VisDrone2019DET数据集中达到26。4AP50:95、44。8AP50,并且在边缘计算设备NvidiaJetsonAGXXavier上满足实时要求(FPS30)。
  如图1所示,还为具有较低计算能力的边缘计算设备设计了参数较少的轻量化模型,这也显示了更好的性能。
  github:https:github。comLSH9832edgeyolo1、简介
  随着计算硬件性能的不断提高,基于深度神经网络的计算机视觉技术在过去十年中迅速发展,其中目标检测是自主智能系统中应用的重要组件。目前,有两种主流的目标检测策略。一种是以RCNN系列为代表的两阶段策略,另一种是一阶段策略,YOLO是最流行的框架之一。对于两阶段策略,在第一阶段使用启发式方法或区域建议生成方法来获得多个候选框,然后在第二阶段对这些候选框进行筛选、分类和回归。单阶段策略以端到端的方式给出结果,其中目标检测问题被转化为全局回归问题。全局回归不仅能够将位置和类别同时分配给多个候选框,而且能够使模型在目标和背景之间获得更清晰的分离。
  在常见的目标检测数据集(如MSCOCO2017)上,使用两阶段策略的模型比使用一阶段策略的更好。然而,由于两阶段框架的内在局限性,它远远不能满足传统计算设备上的实时要求,并且在大多数高性能计算平台上可能面临同样的情况。相比之下,单阶段目标检测器可以在实时指示器和性能之间保持平衡。因此,更受研究人员的关注,YOLO系列算法以高速迭代更新。YOLOv1到YOLOv3的更新主要是对底层框架结构的改进,YOLO的大多数后期主流版本都侧重于提高精度和推理速度。此外,他们的优化测试平台主要是具有高性能GPU的大型工作站。然而,他们最先进的模型通常在这些边缘计算设备上以令人不满意的低FPS运行。出于这个原因,一些研究人员提出了参数更少、结构更轻的网络结构,如MobileNet和ShuffleNet,以取代原有的骨干网络,从而可以在移动设备和边缘设备上实现更好的实时性能,但要牺牲一定的精度。
  本文的目标是设计一种具有良好精度并且能够在边缘设备上实时运行的目标检测器。
  本文的贡献总结如下:设计了一种AnchorFree目标检测器,该检测器可以在MSCOCO2017数据集中实时运行在边缘设备上,准确率为50。6AP;提出了一种更强大的数据增强方法,进一步确保了训练数据的数量和有效性;本文的模型中使用了可重参化的结构,以减少推理时间;设计了一个损失函数,以提高小目标的精度。2、相关方法2。1、Anchorfree检测器
  自YOLOv1问世以来,YOLO系列在实时目标检测领域一直处于领先地位。还有一些其他优秀的检测器,如SSD、FCOS等。当在目标检测任务中测试FPS时,大多数先前的研究只计算模型推断的时间成本,而完整的目标检测任务包含3个部分:预处理、模型推理和后处理。
  由于预处理可以在视频流期间完成,因此在计算目标检测的FPS时应包括后处理时间成本。在高性能GPU工作站或服务器上,预处理和后处理只占一小部分时间,而在边缘计算设备上,所需的延迟甚至是其十倍以上。
  因此,减少后处理计算可以显著提高边缘计算设备的速度。当使用AnchorBase的策略时,后处理的时间延迟几乎与每个网格单元的Anchor数量成比例。AnchorBase的YOLO系列通常为每个网格单元分配3个Anchor。与那些AnchorBase的框架相比,AnchorFree检测器可以在后处理部分节省一半以上的时间。
  为了确保检测器在边缘计算设备上的实时性能,本文选择AnchorFree策略构建目标检测器。目前有2种主要类型的AnchorFree目标检测器,一种是基于Anchorpoint的,另一种是关键点的。在本文中采用了基于Anchorpoint的范式。2。2、数据增强
  数据增强是神经网络训练中必不可少的数据处理步骤。合理使用数据扩充方法可以有效缓解模型的过度拟合。
  对于图像数据集,几何增强(随机裁剪、旋转、镜像、缩放等)和光度增强(HSV和亮度调整)通常应用于单个图像。这些基本的增强方法通常在多图像混合和拼接之前或之后使用。
  目前,主流的数据增强技术,如Mosaic、Mixup、CopyPaste等,通过不同的方法将多张图片的像素信息放在同一张图片中,以丰富图像信息并降低过度拟合的概率。
  如图2(b)所示,本文设计了一种更加灵活和强大的组合增强方法,这进一步确保了输入数据的丰富性和有效性。2。3、ModelReduction
  通过模型缩放,降低了计算成本,可以有效提高模型推理速度。模型缩放方法可分为两类:有损缩放和无损缩放。
  有损缩放通常通过减少网络层和通道的数量来构建更小的网络。无损缩放集成并耦合多个分支模块,通过重参化技术构建更精简的等效模块。模型参数量的降低是通过牺牲精度来实现更快的速度,并且由于耦合结构倾向于降低训练效率,因此通常在模型训练完成后使用重参化方法进行推理。
  通过结合有损和无损缩减方法,本文构建了几个不同大小的模型(如图1所示),以适应具有不同计算能力的边缘设备,并加快模型推理过程。2。4、DecoupledRegression
  从YOLOv1到YOLOv5,对于每个具有不同尺度的特征图,获取目标的位置、类别和置信度的回归使用了一组统一的卷积核。一般来说,如果不同的任务密切相关,则使用相同的卷积核。然而,在数值逻辑中,目标的位置、置信度和类别之间的关系还不够接近。
  此外,相关实验证明,与直接处理所有任务的单一回归检测头相比,使用解耦回归检测头可以获得更好的结果,并加速损失收敛。
  尽管如此,一个被解耦的头却会带来额外的推理成本。作为改进,本文作者设计了一个较轻的解耦头,并共同考虑了模型的推理速度和精度。2。5、SmallObjectDetectingOptimization
  自目标检测研究开始以来,小目标检测问题一直受到广泛关注。随着图像中对象的比例减少,用于表示目标的像素信息减少。与小目标相比,大目标通常占据数十倍甚至数百倍的信息,小目标的检测精度通常明显低于大目标。
  此外,位图图像的属性无法消除这种差距。此外,研究人员发现,在训练过程中,小目标在总损失中所占的比例始终较小。
  为了提高小目标的检测效果,先前的研究提出了以下方法:复制小目标并将其随机放置在图像的其他位置,以在数据增强过程中增加小目标的训练数据样本,这被称为复制增强;图像被缩放和拼接,原始图像中的一些较大目标被缩放为小目标;损失函数旨在通过增加小目标损失的比例来更加关注小目标。
  由于使用方法1处理的图像中存在尺度失配和背景失配的问题,本文只参考方法2和2来优化训练过程。
  本文的数据增强中包括缩放和拼接方法,并重新设计了损失函数,这可以有效地提高中小目标的检测和模型整体精度。3、本文方法3。1、数据增强的改进
  许多实时目标检测器在训练期间使用MosaicMixeup策略进行数据增强,这可以有效缓解训练期间的过度拟合情况。
  如图3(a)和(b)所示,有两种常见的组合方法,当数据集中的单个图像具有相对足够的标签时,它们表现良好。由于数据论证中的随机过程,当图3(a)中的标签空间中存在响应时,数据加载器可能会提供没有有效目标的图像。这种情况的概率随着每个原始图像中标签数量的减少而增加。
  因此作者设计了图3(c)中的数据增强结构:首先,对多组图像使用Mosaic方法,因此可以根据数据集中单个图片中标签的平均数量的丰富程度来设置组数。然后,通过Mixup方法将最后一个简单处理的图像与Mosaic处理的图像混合。
  在这些步骤中,最后一幅图像的原始图像边界在变换后的最终输出图像的边界内。这种数据增强方法有效地增加了图像的丰富性以减轻过度拟合,并确保输出图像必须包含足够的有效信息。3。2、LiteDecoupledHead
  图4中的解耦头首先在FCOS中提出,然后用于其他AnchorFree目标检测器,如YOLOX。证实了在最后几个网络层使用解耦结构可以加速网络收敛并提高回归性能。
  由于解耦头采用了导致额外推理成本的分支结构,因此提出了具有更快推理速度的高效解耦头,这将中间33卷积层的数量减少到仅一层,同时保持与输入特征图相同的更大数量的通道。
  然而,在实验测试中,这种额外的推理成本随着通道和输入大小的增加而变得更加明显。因此,设计了一个更轻的解耦头,具有更少的通道和卷积层。
  此外,将隐式表示层添加到所有最后的卷积层,以获得更好的回归性能。通过重参化的方法,隐式表示层被集成到卷积层中,以降低推理成本。框和置信度回归的最后卷积层也被合并,使得模型可以进行高并行计算的推断。3。3、损失函数的改进
  对于目标检测,损失函数一般可以写成如下:
  其中、、、、和表示分类损失、IOU损失、目标损失和调节损失,、、、、、、为超参数。在实验中将训练过程分为三个阶段。
  在第一阶段,采用最常见的损失函数配置之一:GIOU损失用于IOU损失,平衡交叉熵损失用于分类损失和目标损失,调节损失设置为零。在最后几个Epoch数据扩充的Epoch,训练过程进入第二阶段。分类损失和目标损失的损失函数由混合随机损失代替:
  其中p表示预测结果,t表示GT值,r是0到1之间的随机数。对于一张图像中的所有结果,都有这个结果:
  这表明在小目标的精度和总精度之间有较好的平衡。在第三阶段,关闭数据扩充,将L1损失设为调节损失,用cIOU损失代替gIOU损失。4、实验4。1、消融实验1、Decoupledhead
  2、Segmentationlabels(pooreffect)
  当在数据增强期间处理旋转的标签时,在没有分割信息的情况下,在旋转后获得原始标签框的四个坐标角点,并绘制一个不倾斜并穿过四个点的框作为要使用的标签。这可能包含更多无效的背景信息。
  因此,当在MSCOCO2017上训练模型时,尝试通过使用分割标签来生成边界框,以便图像旋转后的标签仍然保持高精度。当启用数据扩充并且损失进入稳定下降阶段时,使用分段标签可以显著增加23AP。
  由于数据扩充在训练的最后阶段被设置为禁用,因此所有标签都变得更加准确。此外,即使不使用分割标签,最终精度也仅降低约0。04AP。3、损失函数
  4。2为边缘计算设备设计的技巧1、Inputsizeadaptation
  2、多进程和多线程的计算体系结构
  作为一个包含预处理、模型输入和后处理的整体检测过程,这三个部分可以在实际部署中拆分,并分配给多个进程和线程进行计算。在测试中,使用拆分架构可以实现大约814的FPS增长。4。3、SOTA对比
  4。4、总结
  本文提出了一种边缘实时和AnchorFree单阶段检测器EdgeYOLO,其一些代表性结果如图5和图6所示。如实验所示,EdgeYOLO可以在边缘设备上以高精度实时运行,其检测小目标的能力得到了进一步提高。
  由于EdgeYOLO使用AnchorFree结构,因此设计复杂性和计算复杂性降低,并且在边缘设备上的部署更加友好。此外,作者相信该框架可以扩展到其他像素级识别任务,例如实例分割。在未来的工作中,将进一步提高框架对小目标的检测精度,并进行有效优化的探索。
  参考
  〔1〕。EdgeYOLO:AnEdgeRealTimeObjectDetector。

读书和赚钱,是我最重要的两件事作者:马小聪来源:怀左同学01hr最近看刘润老师的文章,很受鼓舞的一句话是:认知贫困,是一个人最大的贫困。什么是认知呢?我用达克效应来解释一下。以……BC省十大最牛博物馆!必须都去一次你知道在BC省最受欢迎的十大博物馆都有哪些吗?每每去了解一个城市,博物馆必是第一选择,因为每间博物馆都是历史的沉淀。穿梭在不同的时代中,感受着文化的洗礼,一定会对这个城市留下深……Steam生存游戏节10款奶茶价游戏推荐,泰克飞船科技含量极对大自然的向往是人类的天性,但是对于未知的自然,贸然出行只会对自己造成危险,因此生存游戏成为了整个游戏圈的大的流向标,为此,Steam游戏平台还特意举办了一场生存游戏节活动,今……央视主持人方琼街头跳舞!打扮时尚秀大长腿,18岁儿子身高一米近日,主持人方琼在社交平台上晒出一段在街头跳舞的视频,并配文称今年第一跳,其状态引发网友关注。当天,方琼穿着一身黑色的打底,高领紧身上衣搭配短裤,身穿宽松的卡其色外套,短……FMVP表现质量值弗格领跑付豪队内第二郭艾伦为1。4直播吧4月23日讯在昨晚CBA总决赛G2中,辽宁男篮以9990战胜广厦男篮,大比分20领先。目前,关于总决赛MVP花落谁家是大家关注的焦点。今天,CBA联赛官微更新微博动……三项关键专利接连发布,国产光刻机开启加速模式据统计资料显示,2020全年我国半导体芯片产业各项细分领域的设备、材料等,累计进口数量达到了5341亿个,总价值超过了3500亿美元,约合人民币2。4万亿,这相当于制造500艘……守望先锋2将在发布时取代现有游戏如标题所述,《守望先锋2》在10月4日开启抢先体验模式,原先的旧版《守望先锋》也随之被2代完全取代。开发团队在RedditAMA中发布确认了这一消息。游戏总监AaronK……中国最好喝的4款酒,100纯酿好喝不上五粮液(浓香)rmb:119952vol产地:宜宾口感:窖香浓郁推荐指数:赖潭(酱香)rmb:26853vol产地:贵州茅台口感……一款像素风格的克苏鲁恐怖生存冒险游戏HELLO大家好,这里是小白的每日一游推荐时间。世上的游戏千千万,有许多好玩的游戏由于缺乏宣传,所以不被广大玩家所熟知。在这里小白每天会为大家推荐一款评价很高但是不太出名的游戏……苹果或于2022年秋季发布无SIM卡槽的iPhone新机上周早些时候,巴西网站BlogdoiPhone放出传闻称,苹果或于部分市场区域推出无SIM卡槽的iPhone15Pro机型。然而周末的时候,一位匿名爆料人又向MacRumors……中国第一批五星级酒店,正在被甩卖五星酒店,破产清算,打折甩卖。这个月初,重庆的一家五星级酒店正在打折拍卖如果你正有意涉足酒店业,那么恭喜,现在是个好时机,你将有机会以七折的价格接收五星酒店。一下净赚几个……霸占刘畊宏直播间榜一,打赏1100万,肖战老婆背景有多厉害?当喜欢肖战的你还在跟着刘畊宏跳操健身时,肖战老婆已经打赏超千万,稳坐榜一大姐的位置。最近,随着刘畊宏毽子操的爆火,一位神秘的富婆也被揭开了面纱。ID名叫肖战老婆的用户空降……
世行预警明年全球或步入衰退发达经济体应牢记货币紧缩的跨境溢出世界银行在官网发布最新的研究报告《伴随着加息,2023年全球经济衰退的风险上升》指出,随着世界多国央行同时加息以应对通胀,可能会在2023年走向全球衰退。同时,新兴市场和发展中……有哪些健康的饮食习惯饮食习惯对人体健康有很大影响,良好的饮食习惯,是人体健康的基本保证。按时吃饭,是对身体最大的保养。每餐七八分,真的可以很好地保持身材了。一定要吃早餐每天到点就吃饭,……万万没想到,iPhone相册还能这么玩,看完直呼iOS你是我iOS作为独立的手机操作系统,不仅异于各类深度定制的安卓系统,即便与原生的安卓相比,在一些功能与体验上也有蛮大的区别!所以接下来就让我们一起来扒一扒iOS相册中看点十足的……芙蓉国评论丨沃土润新枝,茁壮小巨人日前,工信部发布第四批专精特新小巨人企业名单,共有4328家企业入选。加上前三批认定的4762家,中国专精特新小巨人企业即将迈入万字头大关。数量庞大的小巨人企业在专精特新领域扎……国庆节前后换机必备,三款真香机跌至真香价,正是捡漏好时机国庆节前后换机必备,三款真香机跌至真香价,正是捡漏好时机第一款:一加10Pro当时起售价4699起,目前官网3799就能入手,跌了近1000元,但是有一说一,这款手机还是……网友在朝鲜不能随意逛街,朝鲜上班族一天工作八小时必须承认,到朝鲜旅行,团餐很丰盛。每顿有肉有鱼,还有啤酒或者饮料。我们团的游客不多,早上五个人一起吃早饭,身边站着三个服务员,服务员态度很好,也很热情。反而让我们觉得有些拘谨。……逆境实现逆袭!华为Mate50RS保时捷设计评测首创超微距长一、前言:十年之作两年沉淀华为Mate50RS保时捷设计重获新生从2016年到2020年,华为Mate系列步步为营、成功占据高端市场,却在2021年被迫延缓了脚步。……全明星首轮投票结果出炉!库里首轮票王,詹姆斯只排第四?北京时间1月7日,NBA官方公布了今年全明星的首轮投票结果,可以看到,首轮的票王是库里的250万票,排在其后的是杜兰特的230万和字母哥的210万,让人意外的是最近状态十分火热……现役舍己为人的五大球星,克莱任劳任怨,欧文名利双收俗语有言一将功成万骨枯。这句极具哲理的俗语同样适用于NBA舞台。在巨星云集、群星璀璨的舞台上,从来不缺少传奇。但每一个超级巨星成功的背后都有无数球星的助力,强如篮球之神乔……退市的瑞幸咖啡,为何仍能在短期内满血复活?2020年6月,瑞幸咖啡因财务造假,被美国纽约证券交易所强制从纳斯达克市场退市,并罚款1。8亿美元,同时受到国家市场监管总局的6100万元罚款。2021年2月,瑞幸咖啡根据美国……刘诗雯与石川佳纯儿时合照,天真无邪单纯可爱,一晃都成乒坛美女赛场上很少再看见刘诗雯的身影,但场外,刘诗雯却频频现身,参加各种活动,也不知是不是久疏赛场的缘故,刘诗雯给人的感觉是脸又瘦了,人又美了。在国乒女队中,刘诗雯的颜值并非国乒……穿越火线300多种投掷武器,你见过多少种《穿越火线》追求的不仅仅是开枪的爽快感,还有投掷武器带来的乐趣。很多玩家对于投掷武器的理解一片空白,不管在什么模式中都是第一时间全部扔出去,所以很多情况下在开局的时候都会被自家……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网