应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

Facebook在ICCV2021发布两个3D模型,自监督才

  来源:FacebookAI
  编辑:LRS【新智元导读】长久以来CV的训练一直停留在二维数据上,三维数据因为标注成本高等原因都需要专业人员来开发专用模型。Facebook在ICCV2021发布两个3D模型3DETR和DepthContrast,将模型的通用性全面升级,也许标志着CV研究全面进入三维时代!
  从大规模的数据中进行预训练,在计算机视觉中得到了广泛应用,也是在特定任务上得到高性能模型的基础。
  但这种方法有一个致命缺陷,那就是如果目标数据类型还没有大量标注数据的话,就没办法使用这种模式。
  例如3D扫描、识别的标注数据集就很稀缺,主要是因为3D数据集的标注十分耗时,并且用于3D理解的模型通常依赖于与用于训练的特定3D数据集的手工架构设计。
  在ICCV2021上,FacebookAI提出了两个新模型3DETR和DepthContrast,这两个互补的新模型可促进3D理解并更容易上手。新模型建立了简化的3D理解的通用架构,并且能够通过不需要标签的自监督学习方法来解决这些问题。
  代码目前也已开源。
  出于各种原因,目前的CV模型还主要集中在二维图片,但构建机器以了解有关世界的3D数据非常重要。例如自动驾驶汽车需要3D理解才能移动并避免撞到障碍物,而ARVR应用程序可以帮助人们完成实际任务,例如可以可视化沙发是否适合客厅。
  来自2D图像和视频的数据表示为规则的像素网格,而3D数据则反映为点坐标。由于3D数据更难获取和标记,因此3D数据集通常也比图像和视频数据集小得多。这意味着它们通常在整体大小和它们包含的类或概念的数量方面受到限制。
  以前,专注于3D理解的从业者需要大量的领域知识来调整标准的CV架构。单视图3D数据(取自一台同时记录深度信息的相机)比多视图3D更容易收集,后者利用两个或更多相机记录同一场景。多视图3D数据往往是通过对单视图3D进行后处理生成的,但是这个处理步骤有失败的可能,一些研究人员估计,由于源图像模糊或相机运动过度等原因,这个失败率可能高达78。
  DepthContrast主要解决了这些数据上的问题,因为它可以从任何3D数据(无论是单视图还是多视图)训练自监督模型,因此消除了处理小型未标记数据集的挑战。一般的CV模型即使是对大量2D图像或视频进行预训练也不太可能为ARVR等复杂应用产生准确的3D理解。
  https:arxiv。orgabs2101。02691
  自监督学习一直是研究界和FAIR的主要兴趣领域,DepthContrast也是业界在不使用标记数据的情况下学习强大3D表示的最新尝试。这项研究继承自FAIR之前的工作PointContrast,也是3D的一种自我监督技术。
  现在获得3D数据的机会很多。传感器和多视图立体算法通常为视频或图像提供补充信息。然而,理解这些数据以前一直是一个挑战,因为3D数据具有不同的物理特性,这取决于它的获取方式和位置。
  例如,与来自室外传感器(如LiDAR)的数据相比,来自商用手机传感器的深度数据看起来非常不同。AI研究中使用的大多数3D数据都是以单视图深度图的形式获取的,这些数据通过为3Dregistration的步骤进行后处理以获得多视图3D。先前的工作依赖于多视图3D数据来学习自监督特征,训练目标主要考虑3D点对应关系。
  虽然将单视图数据转换为多视图数据的失败率很高,但DepthContrast表明仅使用单视图3D数据就足以学习最先进的3D特征。
  使用3D数据增强可以从单视图深度图生成略有不同的3D深度图。DepthContrast通过使用对比学习来对齐从这些增强深度图获得的特征来实现这一点。
  并且研究结果表明该学习信号可用于预训练不同类型的3D架构,例如PointNet和SparseConvNets。
  更重要的是,DepthContrast可以应用于任何类型的3D数据,无论是在室内还是室外,单视图还是多视图。我们的研究表明,使用DepthContrast预训练的模型在ScanNet3D检测基准上绝对是最先进的。
  DepthContrast的功能在形状分类、对象检测和分割等任务的各种3D基准测试中提供了增益。
  DepthContrast表明自监督学习也有希望用于3D理解。事实上,DepthContrast分享了学习增强不变特征的基本原理,该原理已被用于支持自监督模型,例如FacebookAI的SEER。
  第二个工作3DETR是3DDetectionTransformer的缩写。该模型是一种基于Transformer的简单三维检测和分类架构,可作为检测和分类任务的通用三维模型,该模型简化了用于训练3D检测模型的损失函数,更容易实现。它的性能也相当于或超过了依赖于手动调整的3D架构和损耗函数的现有最先进的方法。
  https:arxiv。orgabs2109。08141
  3DETR将三维场景(表示为点云或一组XYZ点坐标)作为输入,并为场景中的对象生成一组三维边界框。这项新的研究建立在VoteNet和DetectionTransformers(DETR)的基础上,其中VoteNet是FAIR在3D点云中检测物体的模型,DETR是FacebookAI为重新定义物体检测挑战而创建的一种更简单的架构。
  为了实现2D检测的飞跃,FacebookAI之前的研究确定了两个重要的变化,需要解决Transformer的3D理解工作,还需要非参数查询嵌入和傅立叶编码。因为点云在大量空白空间和噪声点之间具有不同的密度,所以这两种设计决策都是必需的。
  3DETR使用两种技术来处理此问题,与DETR和其他变压器模型DETR中使用的标准(正弦)嵌入相比,傅里叶编码是表示XYZ坐标的更好方法。
  其次,DETR使用一组固定的参数(称为查询)来预测对象的位置,研究结果发现此设计决策不适用于点云。取而代之的是,我们从场景中采样随机点,并预测相对于这些点的对象。实际上没有一组固定的参数来预测位置,而是随机点采样适应3D点云的不同密度。
  使用点云输入,Transformer编码器生成场景中对象形状和位置的坐标表示通过一系列的自注意操作来捕获识别所需的全局和局部上下文。例如,它可以检测3D场景的几何特性如放置在圆桌周围的椅子的腿和靠背。
  Transformer解码器将这些点特征作为输入并输出一组3D边界框,它对点特征和查询嵌入应用了一系列交叉注意操作。解码器的自注意力表明它专注于对象以预测它们周围的边界框。
  Transformer编码器也足够通用,可以用于其他3D任务,例如形状分类。
  总的来说,3DETR比之前的工作更容易实现。在3D基准测试中,3DETR的性能与之前手工制作的3D架构相比也有优势。它的设计决策也与之前的3D工作兼容,使研究人员能够灵活地将3DETR中的组件适应他们自己的pipeline。
  从帮助机器人导航世界到为使用智能手机和未来设备(如AR眼镜)的人们带来丰富的新VRAR体验,这些模型都具有巨大的潜力。
  随着手机中3D传感器的普及,研究人员甚至可以从自己的设备上获取单视图3D数据来训练模型。深度对比技术是以自我监督的方式使用这些数据的第一步。通过处理单视图和多视图数据类型,DepthContrast大大增加了3D自监督学习的潜在使用案例。
  自监督学习仍然是跨文本、图像和视频学习表示的强大工具。现在,大多数智能手机都配备了深度传感器,这为提高3D理解和创造更多人可以享受的新体验提供了重要机会。
  参考资料:
  https:ai。facebook。comblogsimplifying3dunderstandingusingselfsupervisedlearningandtransformers

胆子挺肥,停播过7年,还敢用演技砸明星饭碗2021年,贾玲已经拿到了50亿的票房的票房,成为中国票房最高的女性导演。而在9年前,她还在一档节目里边,眉清目秀,上综艺赚钱,养着自己的热爱喜剧表演。。。那会没有……全国摩托车排名(摩托车报价)全国摩托车排名1、世界品牌,3钱江摩托。顶杆是往复运动。中国驰名商标,使用普通车型最好选大企业的产品,价格其实是次重要的。中国名牌。2、像豪爵大阳钱江宗申轻骑嘉陵隆……传媒研究生学校排名(国际新闻学考研学校排名)传媒研究生学校排名1、参照因素是招生规,的大学排名网站给你看了一下。我现在大学的是播音与主持专业,中传大强在播音和广告专业排名。所以需要考虑的因素很多。2、仅供参考……黄磊孙莉一家五口逛颐和园,多多手牵弟弟背影超有爱2月10日,孙莉分享了一家五口逛颐和园的照片,天气晴朗,一家五口出游,大手牵小手,好温暖的画面啊。这张多多手牵着弟弟的照片,背影太有爱了吧。多多留着齐肩短发,身穿白色棉服……镇北堡影视城镇北堡影视城俗称西部影视城,距离银川35公里,市区往返一天好几趟通勤车。《牧马人》、《红高粱》《大话西游》《新龙门客栈》等等都是在此地拍摄的,镇北堡影视城是在是在黄沙漫天……陈情令孟瑶真实身份曝光,他弑父弑兄弑子害死魏无羡网剧《陈情令》开播后立马成为爆款剧屡上微博热搜,大家在嗑忘羡cp的同时,还是会吐槽这部剧的剧情,与原著相比改了很多情节,不过由于不可控原因这部剧能通过审核并上架也已经很不容易了……东海景点排名(东海风景区)东海景点排行1、在公园附近东海上档次的饭店,下面是几个比较,李埝的林场等,的要不就晒太阳没什么景点不过,娃娃鱼啦,有意思的景点,孟良崮旅游区,小东海更。真是惭愧没什么好玩……交通信用卡排名(交通银行信用卡哪种好)交通信用卡排行1、信用卡按级别,积分信用额度招行比较高。现在是我手里额度最低的一张卡,使用Y信用排名卡POWER最适合。交通银行TESCO乐购信用卡。2、其次是广发……娱乐圈本以为没关系,结果却是亲戚的明星,陈奕迅刘德华上班在现实中,我们经常说人际关系,其实亲戚关系也非常严重,说不好听的话,出去办事很多都找熟人或者亲戚,因为这样也确实好办事,就拿娱乐圈来说,亲戚之间共享资源的很多,表面上看起来没什……印度发达城市排名(孟买2021年gdp总量)印度发达城市排名1、GDP增排名速排名80位,但公认的标准是。2、广东省获得GDP第一名,中国东部沿海经济中心,GDP增速6点所以印度去年的增长孟买和通胀考虑进去以……7年前,退伍归来的玄彬为何要在32岁生日会上唱一首旧爱?16日上午,玄彬所属经纪公司VAST通过官方社交账号公开了一封玄彬本人所写的亲笔信,字迹苍劲峻逸,完美应验了字如其人这个理。随后,工作人员还在评论区附上了中文,英文,日文……秋冬季节的扛把子百褶裙,多样搭配,怎么穿都显气质相信很多人都会有一个疑问在秋冬季节这样寒冷的天气里是不是能穿裙子?要知道,女生对于裙子的钟爱程度是非常高的,而且到了秋冬季节,仿佛出镜频率会变得更高,因为裙子对于身材的包容性会……
王一博喜提香奈儿品牌形象大使!官宣了!中国区最年轻一位开篇:恭喜一下,王一博喜提新身份,香奈儿品牌形象大使!彼此成就,恭喜恭喜啊!王一博全新代言,香奈儿品牌形象大使,这次我们可以报喜了!官网同步更新了,中国区的香……虎牙神豪开启新玩法!骚俊连做1000个深蹲,吸金30W近日,风平浪静的虎牙娱乐版块掀起了一股游戏圈钱浪潮,脑洞大开的主播们不断涌现出各类新奇的点子从砸蛋游戏、加时游戏再到如今的深蹲游戏,无一不体现了主播自身的职业素养。作为圈钱游戏……黄家驹逝世二十七年后遗产被曝光江湖还在,那个少年已不在时至今日,Beyond乐队在乐坛依然有着极高的地位,成为不少音乐人的榜样。Beyond乐队并非一出道就红了,也是沉淀了很久,最初以地下乐队的身份举办音乐会,粉丝从个位数慢慢发展……披荆斩棘的哥哥高冷腹黑总裁小说男主终于有了脸《披荆斩棘的哥哥》中,李承铉凭借一首嗓音迷人的低音炮《天上飞》惊艳全场,成为33位中被称赞最多的哥哥。众多网友慕名来看李承铉哥哥的舞台,小编就是其中一个。后来去找了原版去听,始……你是我的荣耀乔晶晶与于途的异地恋,或许可以减少异地分手随着社会的快速发展,有不少年轻人都会出外打拼,他们有些是为了自己的梦想,而有些则是为了家人可以过得更好,但不管是哪一种,都会面临一个问题,那就是异地恋,即便是已经结没夫妻,也是……原来明星也用二手,委曲求全能否换来幸福?她的付出,值得吗?心理学大师欧文亚隆说过:每一桩幸福婚姻的背后,都离不开两个人对彼此的包容和忍耐;也离不开两人的共同努力和成长。诚然,在一段幸福的婚姻里,势均力敌才能相扶相持,共同进……课后延时服务收费标准出台,午餐晚餐全都有,家长这回满意了文教育好能手又到了一年一度的开学季,有很多新的政策也将于秋季开学后正式实施,其中就包括了,中小学生的课后延时服务。中小学生课后延时服务自从提出以来,就备受大众的热议……不说再见大结局仓促,所有谜底被解开,但少了很多该有的铺垫文趣灵儿(文章出品原创号蜗牛娱乐话,禁止转载)大家心心念念的《不说再见》也终于在今晚迎来了大结局。这部剧之前的评价是好坏参半,很多人吐槽这部剧的基调沉重,但是氛围过于轻松……嘉兴十大名菜盘点嘉兴特色菜推荐到嘉兴必吃的美食嘉兴十大名菜1、海宁缸肉海宁缸肉是一道流传于浙江省海宁市及周边地区的著名乡土菜肴,实质为焖缸酥肉。它历史悠久,最早可追溯到远古时期,当时的人类以陶缸烹饪兽肉。后随着……王凯搭档谭松韵,对向风而行挺有好感的职业剧其实是很容易让人提起兴趣的题材,其实这几年新作品也一直没有停过,只不过没有几部足够优秀的作品让大家记住,越是如此观众们越是期待一部好的作品,期待一部真正好口碑的作品。……如何做一个大格局的女生,这十个建议送给你我是用文字温暖你的夕言,点击上方蓝色按键关注我哦。二十出头的时候,我特别羡慕那些看起来勇敢、善良、独立的女人,觉得她们身上有一种独特的魅力,但我说不清楚那到底是什么。……拒绝消费女儿荣誉!全红婵父亲拒收20万企业奖励,仅留下鲜花留本届奥运会女子跳水十米跳台的冠军全红婵究竟有多强,五次起跳,三次满分,用自己完美的表现成为了所有观众称赞的对象。而这位只有14岁的跳水天才也因此成为了很多明星与运动员心中永远的……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网