从机器学习到推荐系统,技术平台全面统一火山引擎已经发动
机器之心原创
作者:泽南
从自动驾驶到推荐系统,机器学习的开发现在都可以用统一的平台完成了。
不同机器学习任务,用统一的平台实现,速度成倍提升,GPU调度0碎片,这是火山引擎最新开放的技术。
7月20日,火山引擎FORCE原动力大会在北京举行。在活动中,品牌发布刚一年的火山引擎公布了一系列最新能力。
在AI方面,火山引擎推出了机器学习与智能推荐平台多云部署解决方案。据火山引擎机器学习系统负责人项亮介绍,字节跳动内部抖音、西瓜视频、飞书等不同业务的AI训练任务,都基于统一的训练平台提交,由统一的训练系统训练。
此次发布的这套解决方案也秉承了统一、开放的理念,初衷是希望算法工程师可以高效地实践自己的设想。
火山引擎机器学习系统负责人项亮。
机器学习能力的统一和开放
火山引擎脱胎于字节跳动的技术中台,其算法工程和业务平台可分为推荐系统和机器学习平台,两者基于字节跳动统一的机器学习系统,后者又基于一套强大的计算基础设施。
这套统一的体系,服务了字节跳动的视频、内容和电商业务。项亮认为,尽管是不同的业务,但本质上都可以抽象成机器学习问题,进行统一的训练。
在抖音中,用户看视频存留的时长和点赞、分享、关注的比例表面上看起来是不一样的,在转化成为机器学习任务后可以总结为同一个问题,即A事件发生时,预测发生B事件的概率。在懂车帝里看完文章评估用户点赞评论的概率,可以类比到电商应用中去,项亮说道。
对于字节跳动这样一个以数据驱动闻名的公司来说,不同的业务体系应用统一化平台的一个最直观的好处,就是减少了变量。因为所有业务底层的工程体系都是统一的,更容易判断出究竟是哪些因素为业务带来了正向的提升,从而可以快速在不同业务中复用有效知识,也可以将创新的想法直接转化为生产力,减少工程投入,增强工程师、研发的单兵作战能力,提升创新效率。
这也是我们这次通过火山引擎,将这套AI基建系统开放给外部企业的原因。项亮说,ToB服务本身就是帮客户专注自身业务,我们把我们擅长的技术服务拿出来,让客户专注于他们擅长的领域。
据项亮介绍,统一架构并不是字节跳动首创,不过从更好地支持业务出发,字节跳动持续打磨这套系统,希望能将性能和体验做到极致,这背后投入了大量的人力和资源。
以火山引擎机器学习平台0碎片能力为例,由于GPU的成本较高,提升GPU的使用效率一直是客户迫切的需求。基于字节跳动庞大的GPU资源,在算力充分大的情况下,系统会对多个用户的不同需求进行动态优化分配。在大多数情况下,火山引擎能够保证所有用户都达到100申请率,不用担心资源碎片的问题。在这套内外复用的系统中,通过复用更大的资源池,可以保证外部客户的0碎片。
火山引擎一直在努力帮助客户降低成本,项亮表示,我们相信只有从客户的利益出发,才能把蛋糕越做越大。
让开发者获得更好体验
在原动力大会上,火山引擎全新发布的机器学习与智能推荐平台多云部署解决方案强调了开发者体验。
很多开发者都会遭遇这样的问题:在构建机器学习业务时,用于训练的GPU通常利用率较低。传统做法一般是给研发工程师配置许多带GPU的物理开发机,而在未进行机器学习训练任务时,这些计算卡会被闲置。火山引擎机器学习平台的独立在线开发机模块,能在对齐物理开发机体验的同时提升效率。
在开发机关机之后,之前进行的操作、下载的数据、配置的环境,在重新开机之后全部原样保留,项亮表示。关机之后,算力同时也会立即释放出去。
开发机模块很好地集成了容器,方便人们在不同环境上进行切换,另外,火山引擎机器学习平台在监控、实验tracking等方面也提供了相应的工具。在复现方案时,火山引擎可以通过镜像方式提供开发环境的解决方案;在工程师开发完成后,可以通过Job化的训练,将开发代码保存在云端,在机器学习平台上一键发起训练,并对比不同实验结果。
不仅如此,在帮助客户实现GPU0碎片的基础上,火山引擎机器学习平台还从计算、网络、存储等方面入手,为开发者带来极致、顺滑的性能体验。
在计算上,火山引擎提供各种算子优化能力,可以让现有的算子速度获得成倍提升。
在通信方面,火山引擎开源了两个通信库,bytePS用于实现参数通信、参数同步;veGiantModel主要实现超大模型的多机并行训练加速。
在存储环节中,火山引擎提供两套解决方案:TOS对象存储和vePFS分布式文件系统,面向实际工作中会遇到的复杂文件、环境处理挑战,同时满足了存储的高性能和易用性需求。
另外,智能推荐系统是字节跳动业务快速发展的重要技术动力,火山引擎推出的智能推荐平台在实时性和规模性上充分利用了已有的实践,可以实现秒级实时更新和超大规模推荐广告模型的训练。
据了解,要想实现一个端到端推荐系统,其工作涉及数据处理、特征工程、规则编排、验证推荐效果等任务。在火山引擎上,这些过程不需要跨多个系统。只需要一个平台,输入用户行为就可以接入到推荐结果输出,搭建完整的推荐服务,不需要关心其中的细节。针对不同行业的客户,火山引擎提供了自定义模板能力,企业可以根据自身业务对工具进行大量定制。
在智能推荐平台中,火山引擎还提供了十余种模型结构,只需要设定好优化的目标就可以开始训练。自定义模型能力则是通过低代码的方式实现模型的开发,平台内置多种代码示例,提供了代码对比、效果对比、训练日志等多种工具,方便工程师更快上手。
无论是预置模型还是自定义模型,火山引擎的底层都是基于一套字节跳动自研的训练和推理方案,可以实现万亿级参数的模型训练,全方位的容错机制保证稳定性,支持流式训练和实时模型调参等特点,可以保证模型训练的性能和效果。
在部署方式上,机器学习平台和智能推荐平台支持四种不同的部署方式,包括公有云部署、VPC部署、私有云和专属AZ部署。
云上增长新动力
字节跳动的发展伴随着深度学习等技术的爆发,同时,我们的系统从一开始就根植于云上。项亮介绍。
字节跳动已经实现了自身业务的全量云原生化。去年底,火山引擎正式发布云计算产品,结合自身的强大能力,火山引擎为企业提供了云原生的全套构建方案。
目前,火山引擎已获得了数千家标杆企业、机构的青睐,服务了金融、能源、汽车、消费电子等众多行业的客户。企业基于火山引擎,正在创造出越来越多的新能力。
基于火山引擎的机器学习平台,无人驾驶技术公司轻舟智航打造了研发工具链轻舟矩阵,全面应用于自身开发体系中。轻舟矩阵以仿真为核心,打通了从数据处理、标注、训练、大规模仿真和技术输出的全流程,实现了车辆数据的安全存储和高效调用,并支持多种车型的开发,可对数据进行自动标注、质检、训练和评估,让自动驾驶AI大脑可以从海量数据中自主学习。
在这其中,火山引擎通过RDMA网络直连的万张GPU,结合自研BytePS分布式训练框架和高性能算子库,使主流模型的多机加速效率超过90,自动驾驶模型训练GPU利用率提升30。模型全生命周期管理工具与火山引擎自研存储的无缝衔接,以及特性化的服务体验,极大加速了轻舟矩阵上自动驾驶模型的训练效率。
在推荐系统方向,火山引擎利用最新硬件架构的特性,借助英伟达对推荐系统Pipeline的定制优化,可以帮助企业快速构建、部署和扩展最先进的深度学习推荐系统,显著降低成本,大大减少任务延迟。
当前,基于云服务的IT基础设施领域正在经历又一次变革:5年前,58的企业选择多云架构。而在2021年,已经有80的企业选择了多云架构,其中79的客户又会选择两个以上公有云。在多云时代,绝大多数应用负载将部署在云原生基础设施上,云原生正在成为企业的数字新基建。
在不断变化的世界里,火山引擎这台发动机,将帮助企业持续保持前进的动力。
ThunderTierOne俯视视角下的硬核战术游戏前言《ThunderTierOne》是一款真实风格俯视视角射击游戏,最高支持四人合作,也可以单人操控四人小队进行任务,在游玩本作时让我想到了《破门而入》,但其难度无疑更加……
2021消费金融数字化转型调研报告(附17家银行优秀案例)完来源:金融数字化发展联盟本报告共分为五个部分。第一部分客观分析了中国消费金融市场现状,包括宏观背景、市场供需变化、政策驱动、移动端用户规模、未来市场空间等基本情况;第二部……
苹果日历App出Bug,多个国家地区无法显示2022年假期IT之家1月6日消息,据MacRumors报道,苹果的iPhone日历App存在一个问题,导致许多国家地区的用户无法看到2022年的假期。据报道,澳大利亚、英国、西班牙、……
倾听世界的声音一、听爸爸和妈妈的话小的时候,喜欢听爸爸和妈妈的话。在我的印象中,从来没有反驳过他们。从小,就热爱劳动,喜欢做家务。喜欢帮助奶奶做饭,帮助妈妈洗衣服。妈妈身体不是很……
独立动作游戏Binary。上架Steam!开放免费测试独立游戏开发者FortyWorks的新作《Binary。》近日上架Steam,该作预定将于2023年年初发售,目前正在免费抢先测试中,不过语言只支持日语。玩家在《Bina……
这七位天才少年能扛起曼联的未来吗?埃里克滕哈格希望在老特拉福德完成球队大修整,并将签下新的球员,但他最终可能会在曼联现有的年轻天赋球员中选拔。我们研究了七名目前年龄在19岁或以下的曼联最佳球员。亚历杭德罗……
带鱼屏真不是普通玩家折腾的不信?在2019年下半年的时候偶然在抖音看到带鱼屏,之前没了解过这类的产品。或者说确实感觉可能和自己没什么交际吧!但是在电商平台看了下价格确实比起16:9的来说也差不多价格。于是还是……
人间仙境,请您来彭山在世界的某个角落里,正发生着一些美好的事情。我说的是彭山,地图的经纬度是111。75,29。63;位置于湖南省常德市澧县。彭山自古有大河门和小河门之分,大河门通向人间仙境……
银行抢人大战有多卷?金九银十,多家银行2023届秋季校园招聘已然拉开帷幕。一年一度的秋季校招往往是银行规模最大、职位最全的一次招聘,也是很多应届毕业生开启职业生涯的第一站。目前,包括农业发展银行等……
金融街处置酒店资产获利7。8亿,三道红线仍踩两道2022年上半年,为控制债务规模,金融街出售了北京酒店资产,获利达7。8亿元,带动了企业盈利规模的大幅增长,但尽管如此,企业的负债结构依旧没有太大改善,三道红线指标仍位于橙档,……
3DM速报尼尔自动人形新场景?官方都是谜语人,传索尼有意SE我只想说谜语人滚出尼尔!1、《尼尔:自动人形》新场景?但官方都是谜语人尼尔社区的尼学家们,最近又疯狂了。原因估计这两天大家也都看到了,一位名叫sadfutago的玩……
火箭队赛程出炉!首战对阵老鹰,格林复制41分表现?感谢联盟助NBA联盟公布了新赛季(20222023赛季)常规赛赛程,揭幕战将于北京时间10月19号打响,而全明星周末则将会在明年的2月18号到20号进行。明年的4月12号15号,将是NB……