应用办公生活信息教育商业
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

火爆全网,只有4页!ICLR爆款论文你只需要Patch到底香

9月17日 尘世客投稿
  来源:网络
  编辑:好困霜叶【新智元导读】顶会投稿竟只写4页?拳打ViT,脚踢MLP,Patch到底能不能成为ALLYOUNEED?
  金秋十月,又到了ICLR截稿的季节!
  一篇Patchesareallyouneed横空出世。
  堪称ICLR2022的爆款论文,从国外一路火到国内。
  509个赞,3269个转发
  知乎热搜
  这篇标题里不仅有划掉还有表情的论文,正文只有4页!
  https:openreview。netpdf?idTVHS5Y4dNvM
  此外,作者还特地在文末写了个100多字的小论文表示:期待更多内容?并没有。我们提出了一个非常简单的架构和观点:patches在卷积架构中很好用。四页的篇幅已经足够了。
  这莫非又是xxisallyouneed的噱头论文?你只需要PATCHES
  这个特立独行的论文在一开篇的时候,作者就发出了灵魂拷问:ViT的性能是由于更强大的Transformer架构,还是因为使用了patch作为输入表征?
  众所周知,卷积网络架构常年来占据着CV的主流,不过最近ViT(VisionTransformer)架构则在许多任务中的表现出优于经典卷积网络的性能,尤其是在大型数据集上。
  然而,Transformer中自注意力层的应用,将导致计算成本将与每张图像的像素数成二次方扩展。因此想要在CV任务中使用Transformer架构,则需要把图像分成多个patch,再将它们线性嵌入,最后把Transformer直接应用于patch集合。
  在本文中作者提出了一个极其简单的模型:ConvMixer,其结构与ViT和更基本的MLPMixer相似,直接以patch作为输入,分离了空间和通道维度的混合,并在整个网络中保持同等大小和分辨率。不同的是,ConvMixer只使用标准的卷积来实现混合步骤。
  作者表示,通过结果可以证明ConvMixer在类似的参数量和数据集大小方面优于ViT、MLPMixer和部分变种,此外还优于经典的视觉模型,如ResNet。
  ConvMixer模型
  ConvMixer由一个patch嵌入层和一个简单的完全卷积块的重复应用组成。
  大小为p和维度为h的patch嵌入可以实现输入通道为c、输出通道为h、核大小为p和跨度为p的卷积。
  ConvMixer模块包括depthwise卷积(组数等于通道数h的分组卷积)以及pointwise卷积(核大小为11)。每个卷积之后都有一个激活函数和激活后的BatchNorm:
  在多次应用ConvMixer模块后,执行全局池化可以得到一个大小为h的特征向量,并在之后将其传递给softmax分类器。
  ConvMixer的实例化取决于四个参数:宽度或隐藏维度h(即patch嵌入的维度)深度或ConvMixer层的重复次数d控制模型内部分辨率的patch大小p深度卷积层的核大小k
  作者将原始输入大小n除以patch大小p作为内部分辨率。此外,ConvMixers支持可变大小的输入。
  实验结果
  在CIFAR10上较小规模的实验表明,ConvMixers在只有0。7M参数的情况下达到了96以上的准确率,证明了卷积归纳偏差的数据有效性。
  不使用任何预训练或额外数据的情况下,在ImageNet1k中评估对ConvMixers。将ConvMixer添加到timm框架中,并使用几乎标准的设置进行训练:默认的timm增强、RandAugment、mixup、CutMix、随机删除和梯度标准裁剪。此外,还使用了AdamW优化器和一个简单的triangular学习率时间表。
  由于算力有限,模型没有在ImageNet上进行超参数调整,而且训练的epochs比竞争对手少。因此,作者表示,论文中提出的准确率可能低估了模型的能力。(是的没看错,原文就是underestimate)
  结果表明,具有52M参数的ConvMixer153620可以在ImageNet上达到81。4的最高精确度,具有21M参数的ConvMixer76832可以达到80。2。
  此外,ConvMixer76832使用的参数仅为ResNet152的三分之一,但其准确度与之类似。
  在224224的ImageNet1k上训练和评估
  更宽的ConvMixer可以在更少的epochs下就实现收敛,但对内存和计算的要求更加苛刻。当ConvMixer的卷积核更大时,效果也更好。ConvMixer153620在将核大小从k9减少到k3时,准确性下降了1。
  在实验中,拥有更小patch的ConvMixers的性能更好,作者表示这是因为较大的patch需要更深的ConvMixers。
  ConvMixer153620的性能优于ResNet152和ResMLPB24,而且参数要少得多,并且与DeiTB的性能接近。
  然而,ConvMixer的推理速度大大低于竞争对手,这可能是由于其较小的超参数的调整和优化可以缩小这一差距。
  算法实现
  网友评论
  对着标题玩梗肯定是少不了的。
  Chinesephilosophyisallyouneed
  Moneyisallyouneed
  对此,来自华科的网友小小将认为这篇论文实在是名不副实。
  一位网友疯狂拆穿,认为这篇论文吹水得过于明显了。
  甚至表示:任何一个ViT、MLP、ResNet模型通过增大输入的patch分辨率,在把计算量提到这么大之后,性能都能比这更好。
  陈小小表示,通篇只比参数量,不比计算量。与同精度的ResNet相比,吞吐量差得离谱。
  当然了,该论文提到的ConvMixer如此简洁优雅,还是有一队网友轮番夸赞的。
  殷卓文表示,这是一篇漂亮得不讲道理的论文,堪称完美。
  结构是常规的结构,不用调参,效果又好,怎能不香呢?
  此外,也回答了之前一位网友指出的问题:这篇论文减小patchsize,相当于增大输入tokensize,与vit等方法是不公平的比较。同时这篇文章的方法实际运行速度慢(throughput)。
  特斯拉AI高级总监AndrejKarpathy也赞叹道:我被新的ConvMixer架构震撼了。
  对于网上这些争论,陀飞轮表示,主要是深度学习的控制变量都不是严格的控制变量这个问题所造成的。
  参考资料:
  https:www。zhihu。comquestion492712118
  https:openreview。netpdf?idTVHS5Y4dNvM
搜索 投诉 评论 转载

迪丽热巴被虫子吓到乱跳,杨洋态度冷淡,为避免炒CP如此避嫌杨洋继《微微一笑很倾城》之后,又出演由顾漫小说改编的爱情都市剧《你是我的荣耀》,男主是杨洋,女主是迪丽热巴,杨洋现实年龄29岁,迪丽热巴现实年龄28岁,但从现场同框看,反而是迪……血腥又暴力,这么性感的女杀手谁顶得住如今提起MaggieQ,最先想到的标签无疑是性感女打星。《碟中谍3》《虎胆龙威4》等大片使她东方打女的形象深入人心,之后她主演的犯罪动作片《妮基塔》也风靡一时。中西……他是郭德纲师弟,四处认干爹拍假广告,让老婆叫爸爸?不论在什么时候,说起娱乐圈总是有着很多瓜等待着吃瓜群众,而这其中的很多瓜呢,都是因为艺人一个不小心的举动,被所谓的网络暴力哄抬到了道德层面,也就是所谓的道德绑架。而也正是因为现……从使徒行者2看如今的港剧靠情怀究竟还能走多远港剧真的是承载了一代人的回忆,小时候的《天龙八部》《神雕侠侣》《创世纪》《法证先锋》可以说是部部经典,拥有大批的忠实粉丝。不过现在港剧真的是有点没落了,取而代之的是韩剧,……火爆全网,只有4页!ICLR爆款论文你只需要Patch到底香来源:网络编辑:好困霜叶【新智元导读】顶会投稿竟只写4页?拳打ViT,脚踢MLP,Patch到底能不能成为ALLYOUNEED?金秋十月,又到了ICLR截稿的季节!……43岁黄奕晒婚纱造型,唇红齿白娇俏灵动,灵气模样梦回李玉湖【作者:楠鱼说娱乐】说起黄奕,当年在《上错花轿嫁对郎》这部古装剧里可是惊艳了多少人,一个性格活泼的李玉湖,一个温婉聪慧的杜冰雁,堪称古装美女的巅峰时代!不知不觉这部……凸嘴猴化芒果脸,这5位男星下颌面缺陷多,却有挡不住的帅气娱乐圈的帅哥很多,而且长相各有特点。看着局促、猴化、歪脸的男星却又挡不住有股子帅气,这就是所谓的缺陷美吧。1。吴磊童星出道的吴磊,看着看着就长成了俊朗少年,还成为了……春来枕星河剧情分分钟劝退观众,她却能凭颜值力挽狂澜?编辑:小颜最近的小甜剧真是多得让人目不暇接了,虽然没有一部剧情上综合实力能打的。但是却让我们嗑颜部发现了闪耀的新星!《春来枕星河》这一部剧情分分钟劝退观……2021。6。29老九门2拍了?露思飞快跑上车?李现钟楚曦怎扒酱每日一爆料扒酱来了【2021。6。29】《天官赐福》主演确定了?宋祖儿现在单身吗?可以说说柴碧云吗?请问许凯和程潇有在一起过?想问一下陈自瑶和王浩信现在关系怎么……中餐厅第四季国内录制游三峡成为移动的餐厅,你期待哪些明星加入第三季的《中餐厅》仿佛还没有过去多久,第四季的《中餐厅》已经要开始录制了。对于饮食文化,国人从来都不将就。如今第四季开始拍摄,《中餐厅》不再走出国门,而是选择了从重庆到武汉的这……她们应该是圈内最可惜的三大女星吧,高颜值演技好,却一直演女配在娱乐圈里面,爱豆有很多,演员也有很多,演员中当主演的和配角的就更多了,有些配角不甘于现状,一直打拼,最终成为优秀的大女主,像是赵丽颖。但也有些演员不一样,他们就喜欢出演……朱之文被别人邀请吃饭,看到他同桌的人,大脑袋很熟悉啊朱之文被别人邀请吃饭,看到他同桌的人,大脑袋很熟悉啊!从星光大道走出来的草根巨星大衣哥朱之文,因为扎实的唱功和朴实憨厚的性格,在大多数观众朋友们的心目中都有着很好的印象,……
张震倪妮版三生三世片花一出就被群嘲,这是电影咖神仙历劫?进入税收违法黑名单,将遇到哪些惩罚?月饼界的劳斯莱斯,尝一口就上瘾,入口爆浆农村一种常见植物天门冬,过去当杂草锄掉,如今价值珍贵26岁女子舍命产子离世,如今丈夫再婚别高估爱情,别低估人性中国的书法博大精深,写什么字用什么笔?这篇文章说太透了有哪些明星整容过度?多事之秋!球王刚走,足坛再失金童罗西我的理财怎么又双叒叕降了?电影濒危物种人是最多情的动物白蛇2青蛇劫起票房破3亿,多部新片来袭,仍有望破5亿2021年高考山西文科一本志愿填报参考
少林寺游记作文登秦望山兼在道作校园一角喝茶就是老样子,不喝茶就是样子老我是个调皮的孩子一年级日记热闹的庙会如何让宝宝遗传父母的优点参芍二藤桑枝茶清热凉血解毒功效这座有六千年历史的古城,藏在江浙沪太久了热文聚热点网 善润了华年怎么判断电脑是新机还是二手作文微信中的陌生人

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找宜春榆林滕州锦州襄阳晋中泰州云南贵港许昌娄底河南乐清寿光阜阳汉中湖北漳州海口陕西延吉东营河源海南