应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

人人皆可变身黄金圣斗士微视用AI燃烧小宇宙,还有不同星座可选

  机器之心原创
  作者:蛋酱
  那些年关于变身圣斗士的梦想,如今能在腾讯微视App就能实现。
  年轻的青铜圣斗士少年们啊,为了大地上的爱与和平,我们将逝去,献上全部的生命和灵魂,融为一体。就在此刻,燃烧吧,黄金的小宇宙!雅典娜啊,请赐予这黑暗的世界一线光明!
  就是这段话,没错,是我们小时候倒背如流的十二黄金圣斗士语录了。很多人也曾暗中想象,自己能成为这群黄金圣斗士的成员之一。现在,变身的机会来了!
  在腾讯微视App,黄金圣斗士铠甲的特效挂件已经正式上线。这是静态照片变身后的样子:
  变身的操作方法也非常简单:用户只需要在腾讯微视App的拍摄页面选择全身换装圣斗士特效,再提供一张无遮挡正面照,即可进行黄金圣斗士铠甲换装。也可以点击本文末的链接,一键体验黄金圣斗士变身!
  或者在拍摄页面选择圣斗士相关特效,按照指示做出相应动作,也能召唤出多个星座的圣斗士:
  除了黄金射手座,还有双子座撒加、处女座沙加、白羊座穆、天秤座童虎哪个是你心目中最厉害的圣斗士?
  双子座圣斗士。
  处女座圣斗士。
  也许会有人思考:在动态视频背景下,如何给画面主体披上全身的黄金铠甲呢?其实,在这一酷炫特效的背后,隐藏着一套复杂的技术方案。微视团队又是如何解决种种挑战并将这一技术落地的呢?
  第一步:运动捕捉
  听到运动捕捉这四个字,很多人也许不太熟悉,但这项技术已经广泛应用于人们熟悉的领域,比如好莱坞大片制作中的那些惊艳特效,比如体育赛事中的运动员动作分析,再比如身体损伤患者的康复评估等,都有这项技术的帮助。
  目前,依赖于惯性、光学传感器的动作捕捉技术已经比较成熟,可以重建出非常精确的人体三维模型信息。但这种动作捕捉解决方案的成本较高,除了需要在捕捉对象的身体上安装造价不菲的传感器,还需要高性能的计算设备对采集到的数据在定制的软件中进行处理,才能得到最终的结果。
  在智能手机早已普及的今天,使用手机端特效增强拍摄效果是短视频应用中的常见玩法。按照应用类型划分,这些靠手机RGB单目摄像头进行动作捕捉相关技术可分为:人脸2D关键点检测(人脸美颜平面贴纸)、人体2D关键点检测(大长腿瘦腰)、人脸头3DMesh重建(人脸立体贴纸头套)、人体3D关键点检测等。但在人体3DMesh重建这方面,业界此前少有成熟的手机端应用,原因主要归于几个难点:缺少大规模高质量的3D数据。人体3DMesh数据的采集成本非常高,同时由于设备的限制,很难采集到大规模贴合用户手机拍摄场景的数据。人脸近似于刚体,有固定的尺寸,不需要考虑形变等因素。而人体属于非刚体,不同的姿态会引起很大的形变,这对视觉技术来说是很大的挑战。人脸有相对固定的特征点,如眉梢、嘴角等部位,但人体缺乏这样稳定的特征点,并且拍摄时衣着的变化很大。人体的深度信息会因为姿态不同发生很大的变化,从二维图像恢复出三维空间信息本身有很多组解,很大程度上依赖于先验信息才能推测出合理的解,而更多的变化就意味着更难去得到有效的先验信息。不同人的体型变化很大,加上穿着不同厚度和材质的衣服,又让体型估计增加了难度。重建出人体Mesh需要同时实现人体检测、人体2D3D关节点检测、人体体型检测、人体姿态和关节旋转检测以及相机投影矩阵回归等多个任务。在手机端计算资源极其有限的情况下,同时完成上述多个任务比较困难。
  但得益于近年来手机处理能力的提升,再加上短视频领域的火爆,这些都大大推动了相关技术的进步,特别是手机端的特效推理引擎技术,轻量化模型技术、移动端的渲染技术等。作为国内顶尖的短视频平台,人体检测技术也是微视团队一直以来深耕的方向。
  相比于其他更简单玩法的挂件,黄金圣斗士在特效复杂程度、效果质量方面都有着更高的要求,微视团队所投入的研发精力也更多。尽管短视频应用中也出现过全身特效的挂件,但一般是贴合度要求较低的蓬松服装或盔甲,而黄金圣斗士铠甲需要更修身、更贴合。
  为了打造黄金圣斗士铠甲特效,腾讯微视发布器技术团队探索出了一套成熟的解决方案。不仅可以打造完美贴合人体的换装,还能在手机上实时运行。在中高端手机上,人体3D重建部分可以达到~90FPS的处理速度。
  制作高质量的3D人体Mesh数据集
  变身黄金圣斗士,首先需要获取到高质量的3D人体Mesh重建数据,微视团队搭建了一套动作捕捉系统,并基于这套系统开发了相应的Mesh重建算法。
  在硬件层面,微视团队采用了一种相对较低成本的搭建方案:3台AzureKinect传感器,3个三脚架,再加上数据同步线、USB延长线和一台Windows电脑即可。
  随后进行简单的标定,只需要抱着一个棋盘格箱子,在场景中转一圈,就可以计算出3台相机之间的相对位置和姿态,仅耗时1分钟。这一步的目的是便于后续的数据融合。
  接下来开始原始数据的采集与处理。首先借助AzureKinect提供的协同(Collaboration)功能将三台相机的视频流做同步处理,然后采集RGBD、深度人体Mask、人体3D关键点信息并保存下来。
  第三步是对每一台深度摄像机生成对应的点云数据,根据相机标定的结果,将三台相机的点云数据进行合成,最终得到统一坐标系下的3D点云数据。
  最后,将获取到的原始数据合成为训练模型所需要的Mesh参数。这一步主要基于Fitting优化的方法,通过对人体的Pose、Shape等参数进行调整迭代,尽量降低重建后人体与3D点云数据之间的误差。微视团队采用3D点位之间的欧式距离(MPJPE)衡量重建效果,整体控制在20mm内。
  最后,微视团队共采集了上万个贴近手机端用户拍摄内容的视频数据,从中抽取了几十万张视频帧图片。其中既有生活中的常见姿态,也包括高抬腿、弯腰、快速蹦跳等高难度动作,以保证数据的丰富性。
  3D人体Mesh如何重建?
  数据准备阶段结束后,微视团队着手重建人体3DMesh。在将视频拆分成一帧帧的图片之后,从每张图片中找到人体所在的区域,然后计算出人体的2D关键点信息,接着结合前后帧的时序信息估计出关键点的深度,即得到人体的3D关键点坐标,然后结合2D3D以及图像信息估计出人的体型和3D姿态,从而获得人体在模型坐标系下的3DMesh和相机的投影矩阵。
  如下图所示是2D3D姿态检测部分的效果:
  获得了2D3D关键点信息后,如果要恢复出人体的Mesh,还要估计两个重要的信息:人的体型以及关节的3D旋转。人的体型可以理解为人的高矮胖瘦,虽然关键点能提供一部分的身材信息,但仅依靠关键点很难准确恢复出身材,特别是胖瘦;3D关键点虽然包含了部分的关节夹角信息,但关节还需要包含更多的自由度,特别是旋转。
  当前,人体3DMesh重建的方案主要分成Fitting和DeepLearning两种。
  基于Fitting的方法一般基于已有的人体模型,如SMPLMANO等,通过最小化人体模型投影到图像上的点与已知人体关键点的误差,得到每张图片的最优模型参数。这种方法的优势在于能够得到高精度的人体Mesh,一些公开数据集(比如3DPW)都采用这种方法构建数据。
  但这种方法的弱点也很明显:首先是速度太慢,每张图片都需要迭代至少几十到上百次,一张图片的处理往往需要一分钟到几分钟的时间。此外,考虑到体型问题,一些方案直接采用3D扫描仪事先扫描出人体,大大提升了数据采集的成本。
  基于DeepLearning的多数方法同样需要依赖于人体模型,通过神经网络估计出人体模型的参数,代表性工作是VIBE,这类算法通常称为modelbased的方法。
  这类方法有两方面的问题,首先可获取到的数据很少而且拍摄环境局现于实验室中,虽然一些工作如Surreal,Human3。6使用CG制作虚拟的inwild场景,但这样的数据跟真实的数据仍然有比较大的差距。第二,前面提到关节的3D旋转很难通过图像去估计。
  相比于modelbased方案,modelfree方案提供了另外一种思路,这种方法是直接回归人体mesh上的密集3D点坐标,并通过在loss中增加人体shape、pose等先验信息进行约束。相关的工作主要依赖于图神经网络来建模人体不同关节点之间的拓扑结构,这方面的代表工作包括Pose2Mesh(https:arxiv。orgabs2008。09047)。
  最终,微视团队使用7000多个顶点和1。5万的面片重建出图像坐标系下的人体3DMesh,从图像中重建出的Mesh需要经过滤波处理去掉抖动,这样就得到了视频中的人体Mesh。效果展示如下图所示:
  后续,渲染引擎将在此人体Mesh信息的基础上给视频中的人物穿上盔甲。
  让黄金铠甲成为手机端特效
  接下来,微视团队在移动端运行了人体检测跟踪、2D关键点检测、3D姿态估计、相机投影矩阵估计、3DMesh重建整套技术的流程,但他们发现,实现单帧图像15ms以内的处理速度非常困难。这意味着,在移动端的实现和优化上,还需要思考更好的解决方案。
  微视团队从三个方面进行了改进:
  1。网络Backbone结构的设计与优化。结合HRNet、MobileNet系列网络等不同结构的优势,在大规模的数据上进行了不同结构设计的探索和调参,针对不同计算能力的手机做针对性的设计,保证对不同的机型在速度和效果上达到最佳的平衡。
  2。算法流程改进。对整个的算法串行的流程进行优化,整个人体检测、2D关键点、3D关键点、人体Mesh、相机姿态估计全部调整为并行实现,极大提升了算法整体的效率。
  3。移动端工程优化。基于腾讯优图团队提供的TNN移动端深度推理框架,实现了移动端模型的高效推理。对于特定的算子和矩阵运算,微视团队与优图TNN团队合作进行了针对性的底层优化,保证算法的高效运行。同时,对于模型的后处理也进行了算法层面的优化,在保证不使用影响体验的精度损失上获得了更极致的运行效率。
  针对不同的拍摄光照、人体的姿态、不同的体型、衣着、拍摄距离、拍摄角度以及不同拍摄背景中发现的BadCase,微视团队从训练方式、参数调整、Loss函数设计、数据更新与优化等方面进行了更多深度的研究,解决了贴合度、检测稳定性等多方面拍摄中的常见问题。同时,进一步压缩了模型计算开销,将单帧的总体处理时长从15ms优化到了当前的11ms。
  经过上述一系列的优化工作后,微视团队基于重建的人体3DMesh,为其量身定制了一套AttachToBody的渲染方案,目标有两个:能够保证服装模型在三维世界和二维图像上位置和旋转正确,贴合人体表面;能够提供PBR(基于物理的渲染)每个环节需要的正确信息,确保高质量的渲染效果。
  同时为了项目需要,技术团队在原有引擎基础上开发了自定义材质系统,为玩法提供了更自由灵活的材质与光照解决方案。借助于强大的流程控制和脚本系统,技术团队很好地将人体重建、服饰真实感渲染、骨骼动画、转场特效等要素串联在一起,提供了完整流畅的视效表达。
  此外,部分机型上启用了IBL、SSAO等技术,以提升整体的光影效果。为了提升在低端机型上的整体效果覆盖率,微视团队采取了MaterialCapture材质捕捉技术方案,用较小的计算成本拟合出近似PBR的真实感效果。同时在一些高频且量大的矩阵计算中启用了NEON加速方案,整体降低了数学计算耗时。
  基于上述所有工作,微视的设计团队与技术团队深入协作。首先明确直观的预期效果,明确优化方向,给出优化建议;此外辅助优化引擎渲染能力,使最终效果更接近设计师预期。
  在细节打磨和工具支持方面,依托LightStudio对3D场景强大的编辑和可视化能力,以编辑器组件的方式提供给设计同学完整的工具链支持,包括对衣服SRT数据的精准调整,对环境光衣服材质主要参数的可视调整等。
  黄金圣斗士铠甲特效的研发历时10个月,最初沟通的预期效果如下图:
  通过设计团队、算法团队和特效团队多轮的效果打磨,衣服贴合度与跟随性,身体比例协调性,衣服视效等方面均达到了理想水平。引擎实现效果如下图:
  未来,微视发布器技术团队将持续围绕三维人体重建来进行创意特效设计与研发。在算法方面会继续在3D重建的精度上持续性的提升,解决更多拍摄场景的需求。业务方面,会结合相关图形图像技术,在人体形变,人体驱动虚拟角色等方面有进一步的突破,为用户提供更酷炫好玩的特效新体验。
  一键体验黄金圣斗士变身:https:h5。weishi。qq。comweishiaccountlogin?rurlhttps3A2F2Fisee。weishi。qq。com2Fiseev22F12FwZm2wHfO02Findex。html3Fwwv3D409626h5materialid3Dshengdoushih526h5materialcategory3Dh5activity3Fchid3D40100300126attach3Dcpreserves3404001000126uploadfrom3D2770

生活知识科普杨梅和鸭子能一起吃吗在我们的生活当中有很多的常识性的知识大多数人都是不知道的,就好比最近就有很多小伙伴咨询小编问小编关于杨梅和鸭子能一起吃吗的这些知识点,这就说明了现在人们也开开渐渐关注起了杨梅和……水马(水马是什么)水马(水马是什么)水马,是指一种可用于分割路面或形成阻挡的塑制壳体障碍物,里边空心,使用时需要注满水(不可充水的木质或铁质可移动障碍物称为拒马)因为外形像马鞍,所以……水马(水马是什么)5月11日,据中国交通报微博交通发布,专家分析,水马是虎门大桥涡振诱因,虎门大桥结构安全,相关抑振措施正在研究实施中。图中圈出部分即为车道上的临时档墙水马。5月5日……爱的错觉!(爱在某个时候是一种错觉!)爱的错觉!(爱在某个时候是一种错觉!)你读他的生活简历,追寻他的足迹,感受他的喜怒哀乐,为他的幸福而高兴,为他的忧郁而忧郁。你认为这就是爱。你读他的话,欣赏他……薛定谔的猫是什么意思(薛定谔的猫是指什么)薛定谔的猫是什么意思(薛定谔的猫是指什么)在日常生活中特别常见,如宠物猫、叮当猫、加菲猫等,甚至是炒到了2千块钱的星巴克猫抓杯,然而今天我们要说的这一只猫在科学界影响非常……薛定锷的猫(薛定谔的猫是指什么)薛定锷的猫(薛定谔的猫是指什么)猫在日常生活中特别常见,如宠物猫、叮当猫、加菲猫等,甚至是炒到了2千块钱的星巴克猫抓杯,然而今天我们要说的这一只猫在科学界影响非常大,不过……日本第一家W酒店开业,年轻人还愿意为这样的设计买单吗?日本第一家W酒店在今年开业了,因为开在了大阪,按照惯例该酒店起名为大阪W酒店(WOsaka)。无论是传承千年的日本文化,还是来自现代的时尚潮流,从任何一个角度去观察大阪都……罗生门什么意思(罗生门)罗生门什么意思(罗生门)从小我们就被教育好人有好报,多行不义必自毙。什么是好人,什么是坏人?这个问题仿佛成为了当今社会最值得思考的问题。好人的懦弱会不会是恶行……上亿只蝴蝶将在云南爆发!北美某蝶见怪不怪原创文章版权归微信公众号把科学带回家所有撰文Mirror《还珠格格》中香妃被群蝶簇拥的场景如梦如幻,而现实只会比这更魔幻。犀牛小编手绘官方消息称,……3个被误解了几千年的汉字,害了多少中国人?中国这几千年以来,有三句话最严重曲解,而这三句话都是因为3个汉字的曲解造成的。中国汉字博大精深,很多字都有多个涵义,然而现代人都不愿意读书学习了,所以仅从字面意义去理解,……生活知识科普钥匙插在门里拔不出来在我们的生活当中有很多的常识性的知识大多数人都是不知道的,就好比最近就有很多小伙伴咨询小编问小编关于钥匙插在门里拔不出来的这些知识点,这就说明了现在人们也开开渐渐关注起了钥匙插……中国古代十大美女(历史上十大美女的经典扮演者!)中国古代十大美女(历史上十大美女的经典扮演者!)众所周知,中国历史上有十大经典美女,就像西施、貂蝉、王昭君等美女的故事都被拍成了影视剧,而扮演这些国色天香美女的演员也都是……
房屋常识惠州南站碧桂园房子办理房产证需要多少费用应该怎么查询很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……房屋常识天津恒盛尚海湾滨海的房子办理房产证需要多少费用要怎么很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……中国的经济理论源远流长博大精深如果让人们不要迷信西方经济理论,可能有的人会不服,还有的人竟然认为中国没有自己的经济理论,只能学习、接受西方经济理论。中国真的没有自己的经济理论吗?显然不是,中国不……离婚官司会查酒店记录吗(离婚官司会查酒店记录)离婚官司会查酒店记录吗(离婚官司会查酒店记录)从某种角度来说,本文的张女士(化姓)还真是个好婆婆。她怀疑儿子出轨,不想儿子做出破坏家庭的事,于是找来私家侦探调查61……离婚官司会查酒店记录吗(离婚官司会查酒店记录)离婚官司会查酒店记录吗(离婚官司会查酒店记录)在去年,个人隐私信息泄露的新闻层出不穷,像华住酒店集团的5亿条公民信息、顺丰3亿条快递数据等等,最近还有那个铁路网站1230……宝宝眼屎多又黄怎么办?宝宝眼屎多又黄怎么办?宝宝眼屎多又黄考虑为细菌性结膜炎,可滴抗菌眼药水抗感染治疗。宝宝眼屎多又黄,很可能是因为眼部不卫生,引起了细菌性结膜炎,家长可以用棉棒蘸取温开……房屋常识买房公积金贷款怎么办理买房公积金贷款需要提供哪些材料很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……警惕土耳其大国梦再起未来世界动乱之源一提起土耳其,估计大家都会嗤之以鼻,他也被广大网友戏称狗中哈士奇国中土耳其,他左右反复横跳连俄罗斯和美国都拿它没有办法。不得不说,随着伊朗和土耳其这两个对中东地区影响重大的国家……房屋常识请问公积金贷款买房都需要什么材料很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……丰田章男将于4月卸任丰田汽车社长1月26日,全球最大汽车制造商丰田汽车的社长(总裁)丰田章男宣布将于今年4月1日卸任,社长一职将由执行董事佐藤恒治继任。丰田章男本人则将接替卸任的内山田竹志,担任会长(董事长)……房屋常识公积金贷款办理抵押需要哪些材料请问有哪位网友晓得很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……流产手术后需要坐月子吗?这个必须要啊,法定政策流产假都是有15天的,老话说得好:小产胜大产,流产需要的护理比正常生产更谨慎细致。流产后的护理:流产后身体比较虚弱,比较容易出汗。建议水可一次喝少量而多次……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网