深度解读ARM新架构大核进取小核摆烂?
众所周知,对于如今的绝大多数的智能手机、平板电脑,以及部分笔记本电脑产品来说,ARM可以说是一切的源头。高通与三星的SoC近年来一直使用着ARM公版的CPU设计,而被公认翻身了的联发科,则靠的是ARM公版的CPU与GPU架构,甚至就连一向标榜自研的苹果,实际上也离不开ARM的基础指令集授权。
正因如此,当ARM方面在2022年6月28日晚间,毫无预兆地突然发布了全新一代的架构方案后,自然也值得我们去进行进一步的分析。
性能概况:大核更强、中核更省,GPU加入硬件光追
开门见山,我们先直接为大家带来ARM这一代新架构的性能相关信息。并且非常令人感叹的是,ARM此次在公布新老架构性能对比数据时居然不再玩巧,事实上,他们给出了可能是史上最详细的性能对比参数。
首先,是全新的CortexX3大核。在使用了完全相同半导体制程、主频和缓存设计的前提下,CortexX3的性能比CortexX2可以提升11。
在使用完全相同半导体制程,但主频和缓存设计按照新老架构的不同典型值做对比时,CortexX3的性能比CortexX2可提升22。
如果再考虑到制程方面的因素,比如假设CortexX3采用新的台积电3nm工艺情况下,此时对比采用台积电4nm工艺、且主频与缓存采用现有设计的CortexX2时,那么新架构的性能领先幅度则会达到25。
其次,是改进型的CortexA715中核,在使用相同半导体制程、相同主频和缓存设计的前提下,新的中核性能相比老设计仅有5的提升,但请注意,此时的能效会比老架构高出20。也就是说其实际功耗此时为CortexA710的87。5,在性能略微提升的前提下省电了12。5,算是比较明显的进步了。
相比于大核与中核的显著改进,新架构里CortexA510小核的改进就比较微妙了。一方面,正如其名称所示的那样,此次的新版小核还是叫做CortexA510,连名字都没变。但另一方面,要说它完全没改又不太对,因为新版的小核功耗比老版本下降了5,同时更为重要的是,其此次加上了对32位应用的兼容性。
但请注意的是,这个兼容性功能是可选特性,并非标配。选配后是有可能会给性能带来负面影响的,但具体影响有多少,ARM方面并没有明确。
除了新版的CPU,ARM此次也同期发布了换代的GPU方案。这一次,新的GPU设计被分为了三档,分别是顶配的Immortalis(不朽)G715、中配的MaliG715,以及入门级的MaliG615。
与本世代的MaliG710和MaliG610相比,新架构首先带来了15的基础效率提升(而且是不考虑制程增益的情况下),其次还支持了VRS可变着色率技术,能够在部分高刷游戏中显著降低渲染负载、对于XR应用也有很大的意义。
不仅如此,作为ARM的全新旗舰GPU产品,ImmortalisG715更是首次引入了硬件光线追踪单元。根据ARM方面的说法,硬件光追单元在GPU核心中仅占据了4的面积,但其相比MaliG710采用的软件光追设计却能够带来300以上的性能提升。考虑到真正支持MaliG710光追效果的游戏至今尚未上市,所以ARM的这番表述属实是背刺自己了。
架构分析:大核更大、中核做减法,小核原地踏步
讲完了新架构的性能参数变化,接下来我们就进入按惯例的架构分析环节,来看看ARM到底是如何实现这些改进的。
首先是全新的大核CortexX3,它的改动无疑是此次新架构中最大的。其包括了比前代大10倍的L0BTB(分支目标缓冲区)和大50的L1BTB,这意味着大幅提高的分支预测性能。根据官方的说法,CortexX3的分支预测延迟降低了12。2,预测错误率降低了6,同时减少了3的前段停顿。由于分支预测性能大为提升,因此CortexX3的mop(微操作)缓存现在可以做得更小,同时流水线长度也进一步下降。
这还没完,与CortexX2相比,CortexX3的指令缓存提取宽度现在从5增加到了6、算术逻辑单元从4个增加到了6个,同时乱序窗口也进一步增大。而在后端部分,新架构的加载存储宽度也增加了50,并增多了数据预取引擎的数量。
更强的分支预测性能,更宽的执行窗口、更短的流水线级别,更快的存取速度,有没有觉得很眼熟?没错,这个改进方向,其实就是多年前已被Intel从奔腾4到酷睿的革新时,所证明的有效路径,只不过ARM如今将其在RISC处理器上复刻了一遍。
相比于CortexX3的锐意进取,CortexA715与(新版)CortexA510的改变就相对没有那么大了。其中,CortexA715的改进主要来自于放弃对32位指令集的支持,从而大幅简化了指令解码器的设计,空出更多的晶体管位置来提高了缓存大小。而CortexA510的变化则更是语焉不详,现在只知道它具备了可选的32位支持、同时功耗略微下降而已。
与CPU部分(特别是大核心)的改动相比,ARM此次的新GPU变化显得就不是那么显著了。一方面,无论是ImmortalisG715、MaliG715,还是MaliG615,它们其实都是共享的相同架构设计(只是ImmortalisG715内部多了硬件光追电路),主要区别还是在于核心数量上做了明确限制。
另一方面,与现有的MaliG710相比,新款GPU在基础架构上将FMA乘加单元的数量翻了一倍,设计了用于抗锯齿的新型FP16计算单元。同时根据ARM方面的说法,新的GPU在重负载场景下的三角形生成率为现有的3倍,纹理映射速度是现有的2倍。不过,暂时还并不清楚这个倍数是来自底层架构的改进,还是来自于核心数量或频率的提升,因此仅仅做个参考就好。真正的GPU性能提升幅度,还得等到实际产品上市后才能有定论。
市场分析:ARM笔记本或将兴起,入门手机也有望翻身
值得一提的是,在发布新一代产品线的同时,ARM还给自家的软硬件方案起了一个新的名字,叫做ArmTotalComputeSolutions(直译为ARM整体计算解决方案)2022,缩写为ARMTCS22。同时,ARM方面也将去年发布的上代架构随之整合为ARMTCS21,并同时预告了明年(TCS23)和后年(TCS24)的产品命名。
这意味着什么呢?从这个举动中,我们至少可以挖掘出两条信息点。一是ARM似乎并不打算用新架构完全取代上一代的产品线,CortexX2、A710和A510得到重命名或意味着它们的授权还将继续。
但更进一步来说,ARM从TCS21到TCS22的变化,以及目前官方已经剧透的TCS23和TCS24不难发现,一方面ARM在TCS22(也就是这一代的新架构上)删除了中核(CortexA715)对32位计算的支持,同时为新版的CortexA510小核增加了可选的32位计算功能。
另一方面,在TCS23和TCS24的预告图里可以清楚地看到,接下来的两年里,ARM每年都会更新大核与中核设计,但小核却只会在2023年迎来一次换代,2024年则是不更新、直接沿用。
与此同时,在此次TCS22官方样板设计中,ARM不仅将新架构支持的最大核心数量从8核扩展到了12核,而且还给出了多个以大核、中核为主的组合方案,甚至出现了完全不采用A510小核,仅由大核与中核构成的超高性能设计。
这或许意味着,ARM仗着新架构,特别是大核(CortexX3)、中核(CortexA715)性能与能效比的显著改善,明显在有意将其往更高的市场定位上推。或许,未来我们就会看到更多基于ARM新架构的笔记本电脑SoC方案了。
其实回溯历史不难发现,此前的CortexA53架构用了四年(20142017)才换代,而CortexA55架构更是坚挺了至少五年(20182022)之久。相比之下,去年的初版CortexA510架构因为完全不兼容32位代码,其实并不适合入门级设备与其他低功耗设备使用。
如此一来,今年的新版CortexA510实际上才是ARMv9指令集下,第一款真正可以用于入门级设备的低功耗CPU架构设计。而最快到明年,它就将会被更新的架构所取代。
换句话来说,面对如今智能手机市场高端产品大放光彩、而入门级设备却销量萎缩的局面,ARM一方面通过新的大核、中核为新旗舰注入了体验继续进步的动力,另一方面也史无前例地针对低端市场进行了补救。
或许在不久后,我们就会看到基于(新版)CortexA510架构,体验明显更加靠谱的入门级主控,或是性能与能效比都大幅进步,总算能与苹果掰掰手腕的Android智能手表平台了。
【本文图片来自网络】
巴图姆文班亚马防守比戈贝尔更全面,他有AD字母波神的影子尼克拉斯巴图姆接受采访,聊到法国球员,2023届准状元秀维克托文班亚马。我第一次见到他时,他才14岁。我之前就听过他的名字。他们说这个孩子2米08,才14岁。看到一个14……
陈鑫打造网红民宿活化利用阳阿文化80后小伙陈鑫现任阳阿清居民宿总经理,晋城民间文艺家协会秘书长,同时还是一名文化策划人。多年来,他始终致力于推动传统文化融入现代生活,坚守着,探索着,践行着,为晋城百村百……
对话十城专精特新宁波10年销售量翻10倍,宁波力达用新模式赋受访企业:宁波力达物流设备有限公司(以下简称宁波力达)第三批国家专精特新小巨人从一家小小的乡镇企业,逐步发展转型成国家专精特新小巨人,宁波力达用了30余年的时间。……
人到六十岁,命里出现这三个征兆,是老天爷在帮你文飞鱼老去是每个人都必然经历的过程,其实大家都希望自己在老的时候,能够得到善待,能够过上好的生活,能够享受清福,能够活得舒心自在。但是每个人的人生都不一样,而且人各……
婚纱特辑捕捉浪漫,2023春夏绝美婚纱大赏在上周举办的纽约奢华婚纱周中,不少品牌释放出2023春夏婚纱系列,优雅古典,极简梦幻,成熟性感,浪漫自然,如下这些绝美婚纱可大饱眼福。1hrNaeemKhanNae……
人们对河桥古镇的看法不一,请您看照片也来评判一下吧游览临安昌化镇河桥古镇江南古镇奇多,但以前从没有听说过这个叫做河桥的小镇。河桥小镇近二年来已成为一处热门的旅游地,许多人前往打卡。4月13日,我参加半山秀溪山庄农乐……
打卡星奇计划!越秀区又多一个商业地标美食街上人头攒动、收银台前排起长队、景区里摩肩接踵随着各项政策措施落地见效,广州消费日渐回暖。五一前夕,位于越秀区海珠广场旁边的星寰国际商业中心成为广州老城区的全新打卡热……
十部iPhone就有九部信号差?该聊一聊苹果手机的老通病了相信,每一位果粉用户对自己的iPhone手机信号表现,或多或少都会有些埋怨吧?依靠着产品技术的创新以及生态方面的优势表现,苹果iPhone手机可以说是一直引领着手机行业的……
因担保债务违约,湘潭九华经投成失信被执行人记者张晓迪因担保债务出现违约,湘潭九华经济建设投资有限公司(以下简称:九华经投)被纳入失信被执行人名单。近日,九华经投公告称,泰富重工制造有限公司以(以下简称:泰富……
这不是第一次,但也是第一次各位culers,大家好!北京时间3月20日04:00,巴萨将在主场对阵皇家马德里。对于主教练哈维来说,这不是他第一次率队迎战皇马,但却是第一次坐镇Spotify诺坎普。此外,……
任正非华为三年完成了13000颗器件的替代开发IT之家3月17日消息,近日,华为公司在深圳坂田总部举办难题揭榜火花奖颁奖典礼,为在解题揭榜中做出突出贡献的获奖人员代表颁奖,华为总裁任正非发表了讲话,部分参与座谈的大学发布了……
原创散文时光的盛放文字:山湖云海经过一中校门口的小巷,看见春天的异木棉开始悄然换着它的枝叶,风中摇曳着自由与灿烂。只是不知为何,还是很怀念之前种植的法国梧桐树,每到三月便抽拔出整串的绿色花……
分手12年后,胡歌与薛佳凝再次同框,粉丝都在等他们复合有一次,鲁豫采访胡歌问:如果你的女朋友不被你妈妈喜欢,那你就不把她娶回家吧?胡歌、薛佳凝休随后无奈地说:是的。鲁豫又道:那你一定是那个你很不喜欢的女孩,因为如果我遇……
不想用盒马鲜生的礼品卡!想要折现怎么办?近日知情人士曝出阿里集团正在考虑与盒马鲜生寻求独立融资,双方估计融资的预估值为100亿美元。而盒马鲜生的独立在未来是有迹可循的。因为在很长的一段时间里,盒马鲜生都因……
45岁大S被曝怀孕,S妈本人回应,谈及对具俊晔与汪小菲的看法相信大家都听说过大S的性格,她可以为爱不顾一切。与汪小菲认识不到两个月就登记结婚,为其生下两个孩子。离婚后又与初恋具俊晔闪婚,目前二人甜蜜恩爱。或许对于大S来说,闪婚不过……
红米K60外观图曝光最近正在看手机,打算换机了,红米K20刚好服役三年了,有些卡了,内存也不够了。其他方面都很好。前几天看红米K50上市,外观确实大气漂亮。CPU不错。足够用了。我不玩游戏。……
如果不差钱,强烈建议中老年人常吃6种零食,既解馋还对身体好如果不差钱,强烈建议中老年人:常吃6种零食,既解馋还对身体好,都是自己在家可以做的,吃起来也更健康放心,下面我们就一起来看看吧!1、花生米食材清单花生粒3斤、香料1……
又一车企被挂牌出售日前,北京产权交易所挂出一则《北京某汽车科技有限公司100股权转让》的公告,该公告中并未披露企业的具体名称,但公布了几项企业的关键信息,包括注册地为北京市通州区,成立时间为20……
大自然缺失症悄悄蔓延,养娃要与自然同行上了小学以后,你家孩子也这样吗?不是写作业,就是上特长班或补习班,游山玩水的时间很少。放松的时候,不是刷视pin就是玩游戏?在生活中,经常是四体不勤,五谷不分……
辽宁四大怪菜,本地人吃不腻,外地人吃不习惯辽宁位于中国的东北部,辽宁的风景具有它自身的独特性,有大连的浪漫之都、华夏之宝、本溪水洞等各种美景美不胜收。谈到辽宁,你首先想到的是什么呢?对于吃货来说,自然少不了的一定是各种……
摘抄第四十天夸克构成的强子夸克构成的强子一般情况下,夸克无法单独存在多个夸克组合在一起的粒子合称子。重子与介子夸克组成的粒子叫强子。在强子中,由3个夸克组成的分类为重子,由2个夸克组成……
8家俱乐部接到准备递补通知,中超能完整开赛全靠足协打让手在4月16日晚,已经有8家中乙、中冠的俱乐部接到了中国足协的函件,通知他们提交2022职业联赛递补申请及相关材料。其中,上赛季从中甲降级的北京理工和新疆天山雪豹获得了递补中甲的……
足球报广州城外援吉列尔梅对回中国松口,正加紧办理来华手续直播吧7月5日讯中超联赛前8轮,广州城遭遇八连败,平了中超历史最差开局纪录。据《足球报》报道,广州城外援吉列尔梅正在办理返回中国的手续。《足球报》在官方微博中写道:经过不……
张继科刘诗雯科雯张继科刘诗雯科雯混双比赛场地缩小对大蟒影响很大,习惯跑动的他适应性训练的时候就感觉束手束脚。练完一天回到房间,张继科听着他的吐槽叹了口气,把他和刘诗雯一起叫出来聊聊天,许……