教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物
解梦组词

1000亿晶体管!IntelXeHPC顶级计算卡秀肌肉

  我们知道,Intel Xe GPU架构分为四个层级,或者说四种微架构,其中以上是的Xe LP低功耗版仅供核显、入门独显,即将到来的Xe HPG高性能图形版面向中高端游戏显卡,Xe HP高性能版适合加速计算、AI、ML等但所知最少,  Xe HPC高性能计算版则是最顶级的存在,主攻大型数据中心、超算。
  Xe HPG微架构的Alchmest(DG2)之前已经聊过了 ,这里来看看Xe HPC和首款产品Ponte Vecchio,竞争对手是NVIDIA A系列、AMD Instinct系列。
  当然,它们距离普通人非常非常遥远,但却是技术实力的最高体现。
  Xe HPC架构的基础也是Xe核心(Xe Core)   ,但因为面向的是计算而非图形,内部结构有所不同,包括8个512-bit矢量引擎、8个4096-bit矩阵引擎,数量对比Xe HPG都减半,但位宽分别翻了一倍、两倍,算力更凶猛。
  矢量引擎每时钟周期可执行256个FP32、256个FP64、512个FP16等数据操作,矩阵引擎则每时钟周期支持2048个FP32、4096个FP64、4096个BF16、8192个INT8。
  与矢量引擎、矩阵引擎搭档的,是一个  更宽的宽加载/存储单元  ,每个时钟周期取回512字节数据。
  每个Xe核心集成512KB一级数据缓存,这是目前业内最大的  ,而且可以通过软件配置作为暂存区使用,又称共享内部显存。
  Xe核心的上一层级叫做“切片”(Slice)    ,不同于Xe HPG上的渲染器切片(Slice),毕竟一个是做计算,一个是做图形渲染。
  Xe HPC每个切片集成多达16个Xe核心  ,四倍于Xe HPG渲染切片的规模,同时还有  8MB一级缓存、16个光追单元、一个硬件上下文(Hardware Context)单元  ,其中光追支持光线遍历、边界框相交、三角形相交,提供固定函数计算。
  硬件上下文单元大家可能比较陌生,它能让GPU同时执行多个应用,而无需昂贵的基于软件的文本切换。
  切片的上一级则是“堆栈”(Stack),至此才算一个完整的GPU。
  一个堆栈包含4个切片,因此总计64个Xe核心、64个光追单元、4个硬件上下文。
  同时,堆栈内还有  大规模二级缓存、4个HBM2e内存控制器、1个媒体引擎、8个Xe链路  ,以及拷贝引擎、PCle控制器。
  Xe HPC架构是可以轻松扩展的,  支持多堆栈设计,属于业内首创,依靠的是EMIB封装和堆栈间互连通道  ,可保持堆栈之间的内存一致性。
  比如  这是双堆栈,整体规模直接翻番  ,它就是后边要说的首款Ponte Vecchio,但看架构图,似乎不支持四堆栈。
  不同的Xe HPC GPU之间通过Xe链路互连,支持最多8颗并行  ,算力直接暴力乘以8。
  Ponte Vecchio作为基于Xe HPC架构的首款产品,一切的一切都是全新的,包括验证方法、软件、可靠性方法、信号完整性机制、互连、供电、封装、I/O架构、内存架构、IP架构、SoC架构。
  Ponte Vecchio是个庞然大物,集成晶体管数量突破1000亿个,使用5种不同的制造工艺,在内部封装了多达47个不同的单元(Tile),包括计算单元、Rambo缓存单元、Foveros封装单元、基础单元、HBM单元、Xe链路单元、EMIB单元,等等。
  如此复杂的芯片设计,面临的挑战自然是空前的,  首席架构师Masooma Bhaiwala直言这是她30年来设计的最复杂的芯片,堪称制造奇迹。
  其中,Foveros 3D封装是一个关键,最终的数据传输速度不得不提高到最初规划的1.5倍,以便以把Foveros连接数量降至最低,但依然比之前任何设计都高了两个数量级。
  开发团队还必须在设计初期就锁定Foveros在所有单元上的位置,这意味着必须一开始就搞定整个平面图布局,中途也不允许有明显变更。
  芯片设计和验证也是全新流程,为此开发了大量新的工具、方法、脚本,并独立安排4个主要单元,开发各自的调试软件包,分而治之,加速开发,最终在SoC整体封装完成几天内就成功启动,运行了Hello World。
  再来看几个关键的部分,  计算单元采用台积电N5 5nm工艺,每个集成8个Xe核心、4MB一级缓存  ,Foveros封装凸点间距36微米。
  基础单元是一个连接器,所有复杂的I/O和高带宽组件都在这里汇聚  ,包括PCIe 5.0总线、HBM2e内存、MDFI链路、EMIB桥接,几乎是在挑战物理极限。
  它采用  Intel 7工艺、Foveros封装,面积达640平方毫米  ,集成了多达144MB二级缓存。
  Xe链路单元是台积电N7 7nm工艺制造  ,负责不同GPU之间的连接,是面向HPC、AI的纵向扩展的关键,每个单元有8条,实现了最高90G Serdes,  可以满足“极光”(Aurora)这样百亿亿次级级超级计算机的需求。
  Ponte Vecchio目前处于  A0版本阶段  (一般到A1就投入量产),成功运行了数百个工作负载,实测FP32吞吐性能超过45TFlops,Memory Fabric缓存带宽超过5TB/s,互连带宽超过2TB/s。
  Ponte Vecchio将有多种产品形态,最基本的单芯片做成OAM模块,集成到一个载体基板上,AMD Instinct也有这种。
  四芯并联组成一个子系统,再搭配双路的下一代Sapphire Rapids至强处理器  ,就是一个超算节点,将用于“极光”超算。
  【来源:快科技】【作者:上方文Q】

大尺寸OLED面板今年需求720万块2023年增至1000万据国外媒体报道,在智能手机之后,电视也在逐步采用OLED面板,对大尺寸OLED面板的需求也在逐渐增加。研究机构预计,今年全球对大尺寸OLED面板的需求预计约为720万块,2023年Google地图获得了扩展后的交通拥挤度预测功能Google今天宣布,它正在将交通拥挤程度预测扩大到100个国家的10000多个交通机构,以便客户能够更好地确定哪些交通方式处于饱和状态,甚至哪些商户有更多的空位可提供。在纽约和悉中航锂电回应宁德时代起诉侵权未接到起诉状宁德时代表示已经正式起诉中航锂电专利侵权,称中航锂电涉嫌侵权范围覆盖其全系产品。中航锂电则表示,公司坚持自主研发,提供给客户的产品都经过专业知识产权团队全面风险调查,公司确信其产品驰援郑州快狗打车组织运力参与救援公益用车河南郑州遭遇特大暴雨灾害,险情发生后,快狗打车紧急响应,协调组织平台司机在保证自身安全的前提下积极参与到救灾行动当中。为保障司机权益,快狗打车面向郑州地区全面推出福利政策,并积极配谷歌将于9月关停冷门书签服务地图中已加星标位置KilledbyGoogle在推特爆料中称在持续了16年之后,这家搜索巨头即将于2021年9月30日关闭一项不太知名的ldquo书签rdquo服务。虽然官方公告没有激起太大的波澜,TwitterBeta版现允许用户使用Google帐号登录据外媒报道,在最初测试中被发现后,最新的Android版Twitterbeta更新现允许用户使用一个连接着的Google账号(GoogleAccount)登录。说实话,Google三星将为谷歌OPPOVivo小米提供柔性屏尽管市面上有多家已涉足柔性显示面板的竞争对手,但三星在折叠屏设备的商业化上仍处于行业领先地位。最新消息是,显示器行业知名爆料人DisplaySearch的RossYoung指出,三Snap押宝AR购物收购3DAR商用平台VertebraeSnap押宝ldquoAR购物rdquo。Snapchat的母公司今天宣布收购Vertebrae公司,后者的主营业务就能帮助品牌创建和管理商品的三维版本。Snap发言人称,VertCassandra4。0暂缓发布因苹果工程师发现一个BUG由于一位苹果工程师发现了存在于Cassandra数据库系统的一个BUG,ApacheCassandra社区决定暂缓发布软件更新。Cassandra是一套开源去中心化的NoSQL数据研究人员开发出一种能弹钢琴的气动计算机存储芯片据外媒报道,美国加州大学河滨分校(UCR)的研究人员开发了一种用于控制软体机器人的空气动力记忆系统。软体机器人就像它们听起来那样它是一种由柔软灵活的材料制成的机器人。哈佛大学的章鱼华为调查问卷高通骁龙898和888机型怎么选数码博主菊厂影业Fans发现,在华为最新一期的调查问卷中竟然出现了高通下一代芯片骁龙898的名称,虽然无法表明下一代骁龙8系芯片将定名898但至少可认为华为有意推出更多搭载高通旗舰
2021年全球前十大半导体买家苹果高居榜首联想第3近日,市场研究公司Gartner发布了2021全球芯片买家TOP10报告,报告显示2021年IT制造商的半导体采购总额为5834。77亿美元(约3。71万亿元人民币),其中苹果独占纪念NBA成立75周年苹果Beats推出限量版PowerbeatsPro纪念美国国家篮球协会(NBA)成立75周年,苹果旗下子公司BeatsbyDre宣布推出一款限量版的PowerbeatsPro。这款耳机是公司和加拿大品牌Better(自称为ldqu工信部拟规定基本功能软件外的预置App均可卸载据工信部发布的消息,为进一步规范移动智能终端应用软件预置行为,提升移动互联网应用服务供给水平,工业和信息化部信息通信管理局会同国家互联网信息办公室网络安全协调局起草了关于进一步规范微星宣布赞助MotoGP雅马哈车队及电竞战队2月24日消息,电竞硬件大厂MSI微星科技宣布了一项新的合作,将成为MotoGP雅马哈车队及电竞战队赞助商,支持他们争夺世界冠军。微星宣布与知名世界摩托车锦标赛MotoGP的Mon还是熟悉的味道诺基亚发布G21新机待机长达3天近日诺基亚悄悄发布了旗下入门机型G20的继任者mdashmdash诺基亚G21,新机在电池屏幕相机等方面都有改进,而且带来了新的省电模式,在日常使用强度下,待机可达3天。配置方面,高德地图上线自定义路线功能想走哪条路直接划线就能导航!一直以来,地图导航App都智能按照条件来选择规划路线,,比如综合距离预估用时花费成本实时路况等等,如果用户自己想选择走其中某一条路非常困难,让人很头疼。而现在,终于有地图App支持长征八号遥二火箭将发射创我国一箭多星记录昨日,长征八号遥二火箭从总装测试厂房垂直转运至文昌航天发射场201工位,预计2月27日择机发射。本次任务火箭为不带助推器的新构型首飞,同时也是一次多用户共享发射,共发射22颗卫星,2022年1月全球热门移动应用下载排行SensorTower发布报告称,2022年1月抖音及其海外版TikTok以将近6700万下载量,蝉联全球移动应用(非游戏)下载榜冠军,较2021年1月增长7。1。其中,抖音的下载NVIDIA我们确实被黑了但没啥事儿!近日,NVIDIA遭到黑客组织攻击的事情引发广泛关注,黑客更是毫不客气地放出了大量机密文件,从中我们看到了NVIDIAAdaHopperBlackwell架构代号,甚至还有DLSS自研GPU追上GTX1050!景嘉微终止通用类芯片项目募投近日,国产GPU厂商景嘉微发布公告称,公司拟终止的募投项目为ldquo面向消费电子领域的通用类芯片研发及产业化项目rdquo,并将剩余募集资金11,345。00万元永久补充流动资金台积电晶圆十八厂第七座工厂将转向5nm据国外媒体报道,由于多家大客户扩大对5nm制程工艺的订单,台积电已决定将原计划用于3nm制程工艺生产线的晶圆十八厂第七座工厂,转向5nm。从英文媒体的报道来看,增加台积电5nm家族