应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

SAM图像分割AI大模型

  如果你认为AI领域已经通过ChatGPT、GPT4和StableDiffusion快速发展,那么请系好安全带,为AI的下一个突破性创新做好准备。
  Meta的FAIR实验室刚刚发布了SegmentAnythingModel(SAM),这是一种最先进的图像分割模型,旨在改变计算机视觉领域。
  推荐:用NSDT场景设计器快速搭建3D场景。
  SAM基于对自然语言处理(NLP)产生重大影响的基础模型。它专注于可提示的分割任务,使用提示工程来适应不同的下游分割问题。
  为什么我们对SAM如此兴奋?
  经过一天的测试,我们可以看到以下令人难以置信的进步:SAM可以通过简单地单击或交互地选择点来分割对象以包括或排除对象。你还可以通过使用多边形工具绘制边界框或分割区域来创建分割,它会捕捉到对象。当在识别要分割的对象时遇到不确定性时,SAM能够生成多个有效掩码。SAM能够为图像中存在的所有对象自动识别和生成蒙版。在预计算图像嵌入后,SAM可以立即为任何提示提供分割掩码,从而实现与模型的实时交互。
  在这篇博文中,我们将了解什么是SAM以及它为何能改变游戏规则,了解它与之前模型相比的表现如何,查看SAM的内部结构、网络架构、设计和实施,并了解SAM在AI辅助标记方面的潜在用途。1、SAMvs。之前的分割模型
  SAM是AI向前迈出的一大步,因为它建立在早期模型奠定的基础之上。SAM可以从其他系统获取输入提示,例如,在未来,从ARVR耳机获取用户的目光来选择对象,使用输出掩码进行视频编辑,将2D对象抽象为3D模型,甚至流行的谷歌照片任务,如创建拼贴画。
  它可以通过在提示不清楚的情况下生成多个有效掩码来处理棘手的情况。以用户提示寻找Waldo为例:
  SAM结果具有开创性的原因之一是分割掩码与ViTDet等其他技术相比有多好。下图显示了两种技术的比较:
  这篇研究论文更详细地比较了这两种技术的结果。2、SAM的网络架构和设计
  SAM的设计取决于三个主要组件:可提示的分割任务可实现零样本泛化。模型架构。为任务和模型提供支持的数据集。
  2。1任务
  SAM接受了数百万张图像和超过十亿个掩码的训练,可为任何提示返回有效的分割掩码。在这种情况下,提示是分割任务,可以是前景背景点、粗框或遮罩、点击、文本,或者一般来说,指示图像中要分割的内容的任何信息。该任务也用作模型的预训练目标。2。2模型
  SAM的架构包含三个组件,它们协同工作以返回有效的分割掩码:图像编码器,用于生成一次性图像嵌入。提示编码器,用于生成提示嵌入,提示可以是点、框或文本。结合了提示和图像编码器的嵌入的轻量级掩码解码器。
  我们将在下一节中更深入地研究架构,但现在,让我们看一下数据集。2。3数据引擎和数据集
  需要数据引擎来支持任务并改进数据集和模型。数据引擎分为三个阶段:辅助手动,其中SAM协助标注者对掩码进行标注,类似于经典的交互式分割设置。半自动,其中SAM可以通过提示可能的对象位置来自动为对象子集生成掩码,标注者专注于剩余对象的标注,从而有助于增加掩码多样性。全自动,人工标注者使用规则的前景点网格提示SAM,平均每张图像生成100个高质量掩码。
  数据引擎构建大段任何10亿掩码数据集MetaAI发布。3、SAM模型的内幕
  3。1图像编码器
  在最高级别,图像编码器(掩码自动编码器、MAE、预训练视觉变换器、ViT)生成一次性图像嵌入,可以在提示模型之前应用。3。2提示编码器
  提示编码器将背景点、遮罩、边界框或文本实时编码到嵌入向量中。该研究考虑了两组提示:稀疏(点、框、文本)和密集(掩码)。
  点和框由位置编码表示,并为每种提示类型添加学习嵌入。自由格式的文本提示由来自CLIP的现成文本编码器表示。密集提示,如蒙版,嵌入卷积并与图像嵌入逐元素求和。3。3掩码解码器
  轻量级掩码解码器根据来自图像和提示编码器的嵌入预测分割掩码。它将图像嵌入、提示嵌入和输出标记映射到掩码。所有嵌入都由解码器块更新,解码器块在两个方向(从提示到图像嵌入和返回)使用提示自我注意和交叉注意。
  掩码被注释并用于更新模型权重。这种布局增强了数据集,并允许模型随着时间的推移学习和改进,使其高效灵活。3。410亿掩码数据集
  SegmentAnything10亿掩码(SA1B)数据集是迄今为止最大的标记分割数据集。它专为高级分割模型的开发和评估而设计。
  我们认为数据集将成为训练和微调未来通用模型的重要组成部分。这将使他们能够在不同的分割任务中取得卓越的表现。目前,该数据集仅在研究许可下可用。
  SA1B数据集的独特之处在于:数据的多样性
  数据集经过精心策划,涵盖广泛的领域、对象和场景,确保模型可以很好地泛化到不同的任务。它包括来自各种来源的图像,例如自然场景、城市环境、医学图像、卫星图像等。这种多样性有助于模型学习分割具有不同复杂性、规模和上下文的对象和场景。
  数据规模
  SA1B数据集包含超过10亿张高质量注释图像,为模型提供了充足的训练数据。庞大的数据量有助于模型学习复杂的模式和表示,使其能够在不同的分割任务上实现最先进的性能。
  高质量的注释
  数据集已经用高质量的掩码仔细注释,导致更准确和详细的分割结果。在SA1B数据集的ResponsibleAI(RAI)分析中,调查了地理和收入分配中潜在的公平问题和偏见。
  研究论文表明,与其他开源数据集相比,SA1B中来自欧洲、亚洲和大洋洲以及中等收入国家的图像比例要高得多。值得注意的是,SA1B数据集包含至少2800万个所有地区的掩码,包括非洲。这是之前任何数据集中掩码总数的10倍。
  我们认为SA1B数据集将进入计算机视觉名人堂(与COCO、ImageNet和MNIST等著名数据集一起)作为未来计算机视觉分割模型开发的资源。4、SAM是开源的吗?
  简短的回答是,YES!SA1B数据集已作为研究目的开源发布。此外,遵循FAIR对开放研究的承诺,MetaAI发布了预训练模型(大小约为2。4GB)和Apache2。0(宽松许可)下的代码。它可以在GitHub上免费访问。还提供了训练数据集以及交互式演示WebUI。
  所有链接都来自项目网页:
  5、基于SAM的AI辅助标记
  我们将SegmentAnythingModel(SAM)视为AI辅助标记的游戏规则改变者。它基本上消除了使用多边形绘图工具分割图像的痛苦,并允许你专注于对您的模型更重要的数据任务。
  这些其他数据任务包括映射不同对象之间的关系,赋予它们描述它们如何行为的属性,以及评估训练数据以确保它是平衡的、多样化的和没有偏见的。
  6、使用AI增强手动标记
  SAM可用于创建AI辅助的工作流程增强功能并提高标注者的工作效率。以下是我们认为SAM可以做出的一些改进:
  提高准确性:标注者可以获得更精确和准确的标签,减少错误并提高注释数据的整体质量。更快的标注:毫无疑问,SAM将加快标记过程,与合适的图像标注工具结合使用时,使标注者能够更快、更高效地完成任务。一致性:让所有标注者都使用一个版本的SAM将确保标注之间的一致性,这在多个注释者处理同一个项目时尤为重要。减少工作量:通过自动分割复杂和复杂的结构,SAM显着减少了标注者的手动工作量,使他们能够专注于更具挑战性和更复杂的任务。持续学习:随着标注者改进和纠正SAM的辅助标记,我们可以实施它,使模型不断学习和改进,从而随着时间的推移获得更好的性能并进一步简化标注过程。
  因此,将SAM集成到注释工作流程中对我们来说是轻而易举的事,这将使我们当前和未来的客户能够加速尖端计算机视觉应用程序的开发。7、SAM如何为AI辅助标记做出贡献
  要举例说明SAM如何有助于AI辅助标记,请考虑之前的医学图像示例。我们将DICOM图像上传到SAM的演示WebUI,并花了10秒钟单击图像以分割不同的兴趣区域。
  之后,我们使用多边形标注工具进行了手动标记,耗时2。5分钟。SAM标注速度提高15倍!
  8、真实世界的用例和应用程序
  SAM几乎可以用于你能想到的每一个分割任务,从实例分割到全景分割。让我们感到兴奋的是,在你的专家审阅者将本体添加到顶部之前,SAM可以多快地帮助你使用几乎像素完美的分割蒙版预先标记对象。
  从农业和零售到医学图像和地理空间图像,使用SAM可以实现的AI辅助标记是无穷无尽的。这就是为什么我们对这项新技术感到非常兴奋。9、SAM会给我们留下什么?
  SegmentAnythingModel(SAM)真正代表了计算机视觉领域的突破性发展。通过利用可提示的分割任务,SAM可以使用提示工程来适应各种下游分割问题。
  这种创新方法与迄今为止最大的标记分割数据集(SA1B)相结合,使SAM能够在各种分割任务中实现最先进的性能。
  凭借显着增强AI辅助标记并减少图像分割任务中的人工劳动的潜力,SAM可以为农业、零售、医学影像和地理空间影像等行业铺平道路。
  作为一个开源模型,SAM将激发计算机视觉的进一步研究和开发,鼓励AI社区在这个快速发展的领域突破可能性的界限。
  最终,SAM标志着计算机视觉故事的新篇章,展示了基础模型在改变我们感知和理解周围世界的方式方面的力量。
  原文链接:http:www。bimant。comblogsamsegmentanything

带1000元人民币去缅甸,能享受什么服务?了解后,原来是这样说到外出旅游,虽然是简单地出去走走看看,了解当地的风土人情,其实也别有一番滋味。如果小伙伴们选择去东南亚地区的国家游玩,他们可以选择去翡翠王国缅甸游玩。(此处已添加小程序……奉劝董路消停一下吧,现在这场争论已经变成挖黑料混战了在网上争论不休的所谓冯巩大战,其实叫做董巩大战更贴切,冯潇霆虽然是重要的引子,但终究参与争论并不多,也不是斗争的主要主要方向。现在基本演变成董路舌战群儒的现象了,董路这一方面他……与君初相识首播战报,任嘉伦无台词演技获赞,优酷发文我笑了由任嘉伦迪丽热巴主演的古装神话剧《与君初相识》大家都看了吗?会员一口气更新四集,连更9天,你们是准备天天等还是攒攒一起再看呢?关于这部剧好不好看,我来说说我看过之后的感受……多国出现德尔塔克戎,专家目前不必过度担忧(人民日报健康客户端记者孔天骄)由德尔塔和奥密克戎重组的新病毒变体德尔塔克戎(Deltacron)已经在法国、荷兰、巴西和丹麦等多个国家被检测到。有人会发出疑问,当德尔塔、奥密……茄子还可以这样做说到茄子呢,相信不少的朋友们都爱吃!这样说应该没有人会反对吧!个人认为,只要是茄子的做法,基本都是非常的下饭的!茄子煮熟后,口感软糯,并且茄子营养丰富,含有蛋白质、脂肪、碳水化……十日内北向资金净买入最多的20股,最新数据来了北向资金净买入最多的20股,最新数据来了!统计时间:3月12日。喜欢就点个赞!每天分享最新市场数据!十日内北向资金净买入最多的20股序号代码……俄罗斯自助游四自助游的时间是2018年10月国庆节期间,以下是回忆录。今天要去圣彼得堡。准备坐火车去。莫斯科到圣彼得堡火车8个小时,睡一晚正好到。200多块钱。车上不检票,进站很宽松。……菠菜和鸡蛋做的拌菜,酱香浓郁,味道清香特别好吃,下饭下酒不错嗨大家好!我是小猫爱厨房的小猫,今天又和大家见面了,分享生活、分享美食、分享快乐!今天给大家带来的是一道用菠菜和鸡蛋制作的拌菜,这是一道口味清淡,特别爽口开胃的下饭菜,今天把它……多巴胺快乐是一种瘾,内啡肽才是更高级的快乐生活中,你有没有这样的经历?熬一次夜、通一次宵,虽然当时很快乐,但之后几天的昏沉和疲惫却让你后悔莫及;跑一次三千米、读一本晦涩的书,尽管当下可能很抓狂,但完成后却总……待产包攻略今天终于趁宝宝睡觉,整理下我的待产清单,供后续宝妈借鉴〔比心〕一、宝宝用品:1。NB码纸尿裤(剖宫产住院期间带40片左右,每天大约需要10片)2。包单4条(住……与你分享三个生活方式健康越来越受到人们的重视,怎样才能健康?我与你分享三个生活小常识:01。饭后走一走。孩提时,听年长的讲,饭后百步走,活到99。我有两个朋友是给老板开车的,年龄都是30出头……著名演员瑞茜。威瑟斯彭和格温妮丝。帕特洛推动建立加密货币姐妹一场明星云集的运动鼓励女性闯入加密货币和NFT的世界女演员GwynethPaltrow、ReeseWitherspoon和MilaKunis为女性带来了一个新的赋权信息她……
一龙要挑战死神方便,为什么这次大家都站在一龙这边?相信大家看了标题就知道小编今天要写武林风三个最牛的代表人物,分别是武僧一龙、死神方便、王洪祥,前面两个还活跃在武林界,虽然现在很少有比赛,但是热度依然不减当年,他们的一举一动都……模玩资讯LEGO75321曼达洛人剃刀冠号乐高Microfighter系列将推出《曼达洛人》剃刀冠号,编号为75321。Microfighter是利用约100片左右的零件重新诠释《星球大战》当中经典载具的有趣系列……泰国,美的不只是风景,服务更是旅行必选的理由泰国作为东南亚最受游客欢迎的国家,不单单是旅游资源丰富,更重要的是,泰国独特的服务,这才是留住游客最重要的因素。(此处已添加小程序,请到今日头条客户端查看)大家都知道泰国……文案特别喜欢的小众高级短句1。忙碌会冲淡所有的复杂情绪2。你不断的翻文案,只不过在找一个替你讲故事的人3。我们曾如此期盼外界的认可,到最后才知道,世界是自己的,与他人毫无关系4。经年一……王者荣耀S28赛季戈娅上线,分析一下这个英雄技能和配合英雄各位王者小伙伴,S28新赛季已经正式开启,不知道各位昨天有没有上分呢?软豆鏖战一晚,看看成绩不上不下,白折腾了哈哈哈(囧)。其实早就有心理准备,赛季初本来就是大乱斗的场面,小白……大宅门中为什么清朝灭亡之后,白大爷没有回到北京《大宅门》是由中央电视台影视部、无锡中视股份公司联合出品的家族剧,该剧讲述了中国百年老字号百草厅药铺的兴衰史以及医药世家白府三代人的恩恩怨怨。这个电影从一开篇就引出了白家……张静初不寻常的美她演绎了很多的影视剧作品,她有很多的角色实力扮演,她因此而荣获了国内外一系列荣誉大奖,她还是位非常有天赋的运动达人。她是谁呢?她就是实力派演员张静初。接下来让我们一起走进张静初……知识城再次告别无共享单车可骑的历史雍景湾投放点随着知识城快速发展,进驻的企业越来越多,使该区域的居住人口迅速增长,居民往返于企业、超市、地铁站、学校和住宅小区间的出行需求急速增加。旺村地铁A口投放点……俞敏洪未来会开新东方电商学院,让董宇辉等著名主播去上课Tech星球6月21日消息,日前,俞敏洪在一场直播中提到,未来可能会开电商学院。目的不是为了挣钱,而是为了让中国主播的整体水平得到一个层次的提高。并称成立后会亲自上课,也会让董……为什么不建议购买小米MIX4了?老师傅列出三大理由,看完就懂今天写这篇文章心情还是比较沉重的,因为和很多米粉一样,小编对这款时隔三年回归的MIX系列机型还是有非常大的期待,期待想曾经的MIX系列一样,这次会不会又有什么黑科技引人注意;但……郭珍霓为什么退出娱乐圈?戏红人不红,但江湖上到处都是她的影子有人评价郭珍霓是最适合演红颜祸水的女演员,媚骨天成。郭珍霓明明长的乖巧,但各种角色她都可以驾驭,祸国殃民的妖妃、魅惑人心的妖精、为了爱情不择手段的女配、蛮横无理的大小姐、……DOTA2液体提前锁定major参赛名额,TNC变阵导致降级在DPCS联赛欧洲赛区当中,经历了5连胜之后,液体已经提前确定了他们的major参赛席位。队伍当中的新援zai以及MATUMBAMAN在队伍当中立下了汗马功劳,这支全新的阵容在……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网