应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

ModelMesh走向开源使开发者能够大规模部署AI模型

  模型服务是AI用例的一个关键组成部分。它涉及从人工智能模型中提供推论,以响应用户的请求。那些涉足企业级机器学习应用的人知道,通常不是一个模型提供推论,而是实际上有数百甚至数千个模型在同步运行。
  这在计算上是一个非常昂贵的过程,因为你不可能在每次要提供请求时都启动一个专用容器。这对在Kubernetes集群中部署大量模型的开发者来说是一个挑战,因为存在一些限制,如允许的最大荚数和IP地址以及计算资源分配。
  IBM通过其专有的ModelMesh模型服务管理层为Watson产品(如WatsonAssistant、WatsonNaturalLanguageUnderstanding和WatsonDiscovery)解决了这个难题。由于这些模型已经在生产环境中运行了几年,ModelMesh已经针对各种场景进行了全面测试。现在,IBM正在将这一管理层与控制器组件以及为模型服务的运行时间一起贡献给开放源码社区。
  ModelMesh使开发者能够在Kubernetes之上以极端规模部署AI模型。它具有缓存管理的功能,也是一个平衡推理请求的路由器,模型被智能地放置在pod中,对临时中断提供弹性。ModelMesh的部署可以轻松升级,无需任何外部协调机制。它自动确保一个路由新请求到它之前已经完全更新和加载。
  在用一些统计数据解释ModelMesh的可扩展性时,IBM表示:
  一个部署在单个工人节点8vCPUx64G集群上的ModelMesh实例能够打包20K个简单字符串模型。在密度测试的基础上,我们还对ModelMesh的服务进行了负载测试,通过发送成千上万的并发推理请求来模拟一个高流量的假日季节场景,所有加载的模型都以个位数毫秒的延迟进行响应。实验表明,单个工人节点支持20k个模型,每秒最多可进行1000次查询,并以个位数毫秒的延迟响应推理任务。
  IBM将ModelMesh贡献给了KServeGitHub组织,该组织早在2019年就由IBM、Google、彭博社、英伟达和Seldon联合开发。
  您可以在下面提到的各种GitHub存储库中查看ModelMesh的运用与实现:
  模型服务控制器
  用于协调模型放置和路由的ModelMesh容器运行时适配器
  ModelMesh运行时适配器在每个模型服务pod中运行的容器,充当ModelMesh和第三方模型服务器容器之间的中介,它还包含了负责从存储中检索模型的拉动器逻辑。
  tritoninferenceserverNVIDIA的Triton推理服务器
  seldonmlserverPythonMLServer,是KFServing的一部分
  【来源:cnBeta。COM】

婚检是强制的吗婚检是为了男女双方有一个健康的家庭环境,孕育健康的生命,下面来看看婚检是强制的吗?一、婚检是强制的吗不是。1、自从2003年之后的婚检都是遵循新人的意愿了,所……美光科技第一财季营收76。9亿美元同比大增但环比明显下滑12月21日消息,据国外媒体报道,存储芯片及存储解决方案供应商美光科技,在当地时间周一发布了2022财年第一财季的财报,营收同比大幅增加,但环比明显下滑。从财报来看,在截……喝水尿多什么原因喝水尿多或是这原因生活当中我们经常会有这样的情况,喝完水之后没多久就想尿尿了,而且喝水尿也会变得,那么喝水尿多是什么原因导致的呢?喝水尿多的原因有哪些呢?下面就为大家介绍一下哦!一起来看一看吧!……网易投资游戏开发商成都猫之日后者股东含B站企查查APP显示,近日,成都猫之日网络科技有限公司发生工商变更,新增股东杭州网易雷火科技有限公司,同时公司注册资本由125万元人民币增加至149。31万元人民币。企查查信……一个月内四款!NVIDIARTX30新卡发布时间定了ldquo;空气卡rdquo;又怎么了?NVIDIA将在接下来一个月的时间里,连续发布四款显卡,从高端到低端全覆盖。RTX3090Ti24GB北京时间2022年1月……NVIDIARTX206012GB本月底批量上市NVIDIA日前低调发布了新款RTX206012GB,而且低调得不像样,没有官宣消息,甚至连官方建议零售价都没给。各大AIC厂商纷纷发布了自己的新品,但上架的寥寥无几,京……NVIDIACES2022发布会定档预计将推出RTX3090NVIDIA官网显示,其CES2022专场发布活动时间定在太平洋时间1月4日上午8点,对应北京时间1月5日0点。因为是消费电子展,所以NV此次的新品都是游戏显卡相关,预计……LHR显卡被破解只能恢复部分性能NVIDIA明年底显卡就好买在游戏卡市场上,最近一年来无法绕过的问题就是工头们抢购显卡挖矿导致的显卡涨价、缺货,AMD及NVIDIA都在强调矿卡对他们的业务影响不大,但现实中玩家的感觉不是一回事。相……美国公布新超算采用NV下一代GPUNVIDIA的下一代GPU,终于含蓄地揭开了神秘面纱。本周三,美国可再生能源实验室(NREL)宣布将建造新超算Kestrel,合作方是HPE(惠与)。配置上,这套超……现榨橙汁全智能自动贩售无需店面也能赚钱在今年特许展上一个称为Vingoo维果部落全智能现榨橙汁自助销售终端颇受瞩目。几乎从展会开展的那一刻起,该展位就一直被投资者围得水泄不通。而该设备不久之前还刚刚亮相人民大会堂的……动物牢骚多乌鸦:原来中国男足踢得不好,大家都怪我这张乌鸦嘴。可我调静音模式都三年了,这国足咋还老是输球呢?猫:现在到处都在搞全民卫生运动,都快把老鼠灭绝了。……Intel12代酷睿Z690主板成本分析新插座贵了4倍Intel12代酷睿目前只有一款主板Z690,而且定位高端,价格自然高高在上,但是对比上代Z590,它又更贵了一些。这是为什么呢?TPU做了一番挖掘。最昂贵的部件当……
Xanadu和Imec合作开发用于容错量子计算的光子芯片全栈光子量子计算公司Xanadu和世界领先的纳米电子和数字技术研究与创新中心Imec日前宣布建立合作关系,共同开发基于超低损耗氮化硅(SiN)波导的下一代光子量子位。Xa……道路施工临时安全措施有哪些道路会定期进行养护,一旦发现道路出现损坏,那么就需要施工维修,那么道路施工临时安全措施有哪些?这些道路安全小知识我们请本站的小编介绍下。施工作业单位应当在经批准的路段和时……女人爱恋父亲男人据《新科学家》杂志报道,一项最新的研究结果显示,女人倾向于挑选长得像她的父亲的男人作自己的丈夫,即使这些女人是养女也是如此。Psy525。cn负责这项研究的匈牙利佩斯大学……老而不死是为蒙每当我看到文学泰斗王蒙一脸高深莫测的时候,就油然而生铁掌水上漂裘千仞的形象。对不起,是裘千丈,脚下有木桩,宝剑可伸缩,那块大石也是醋先泡过的,但架不住白衣飘飘、一苇渡江,引无数……华为招募鸿蒙HarmonyOS学生体验官学术类等华为鸿蒙官方表示,HarmonyOS学生体验官超新星计划开启招募!HarmonyOS学生体验官分为学术类、玩机类、娱乐类三大主题体验,截至9月17日,可预约成为星学员,体验更好……通宇通讯中标中国联通天线大单把握更大市场机会昨日,中国联通公示2021年度天线集中采购结果。本次集采共两个标包,采购低中频44端口等6款天线19。93万副、中频4端口等3款天线17万副、低频4端口1款天线0。41万副、工……肌体造句用肌体造句大全三十一、肌体更容易感染滤过性病毒和细菌病毒。三十二、但是当人们感受到爱的温暖的时候,人体内会发生有助于肌体康复的生理变化。注意到这一点真是令人大为惊异。三十三、受贿……女性冬天喝什么茶好1、红糖姜茶:红糖姜茶专门为手脚冰冷的女孩子推荐。如果有大姨妈痛的也可以饮用哦!红糖补血,姜是温性的东西,如果有点感觉要感冒了赶紧趁热喝一杯然后睡一觉就立马好了;2、普洱……独居谨防星期天抑郁症星期天抑郁症的解决之道星期天等节假日到来时,你会感到孤独烦躁、心神不宁吗?心理学家称这种现象为星期天抑郁症。Psy525。cn星期天抑郁症既是心理疾病也是社会疾病。最重要的是无法解决星期天想要……芯片短缺,现代汽车及起亚8月份美国销量同比下滑4。59月2日消息,据国外媒体报道,今年年初就已开始的全球性汽车芯片短缺,目前仍在持续,不少厂商仍被芯片短缺所困,汽车的生产和销售都受到了影响,有不同程度的下滑。现代汽车和起亚……中国电信以科技创新,加速5G赋能数字经济发展第九届ldquo;未来信息通信技术国际研讨会rdquo;8月30日在京举办。本届研讨会以ldquo;创新驱动下的ICDT未来十年rdquo;为主题,围绕信息通信技术领域创新和未……中国联通马红兵构建CUBENet3。0,迈向智能网络新时代2021世界5G大会(W5GC)今日在北京拉开帷幕。在8月30日举办的ldquo;未来信息通信技术国际研讨会rdquo;上,中国联通科技创新部总经理马红兵发表了题为《构建……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网