重回数据中心CPU王座! 英特尔至强6性能核处理器简析
继今年6月6日发布至强6能效核处理器(Sierra Forest)之后,英特尔也于今天在中国正式发布了至强6性能核处理器(代号Granite Rapids),作为针对AI、数据分析、科学计算等计算密集型业务推出的数据中心CPU产品,至强6性能核处理器在性能、内核密度、内存和I/O创新都有十分明显的突破,在多个实际负载中的表现相当出色,特别是今天宣布上市的至强6900P系列处理器(代号Granite Rapids-AP)在对上AMD Zen4 EPYC时也是丝毫不落下风,部分负载更是实现了大幅领先。
架构设计与性能表现
作为第六代至强处理器的P核版,Granite Rapids的核心代号为Redwood Cove,单个核心具有2MB的L2缓存,支持超线程技术。支持AVX-512指令集和AMX加速引擎,可用于AI和向量运算。每核心拥有64KB指令缓存和48KB数据缓存。此外,它支持512指令乱序执行引擎,能够更好地优化编程中的软件指令。
虽然与代号为Crestmont的能效核核心在微架构层面上有显著区别,但是模块化的SoC架构实际上是允许能效核处理器和性能核处理器共享一个底层平台的,因此在部署时也会更加便利。
与第五代至强不同,至强6的设计理念发生了改变,采用按功能块进行划分的方式,即把UPI、PCIe控制器、DSA/IAA/QAT/DLB等加速器及I/O Fabric划分为I/O die,CPU核心部分组成的矩阵与(就近的)内存控制器划分为计算Die,然后通过EMIB(嵌入式多芯片互连桥接)将计算die与I/O die连为一体。同时由于计算die对计算密度和核心逻辑密度要求较高,因此采用了最新的Intel 3制程工艺,与高速I/O相关但对密度要求不高的I/O die则采用了成熟的Intel 7工艺,其中性能最强的至强6900P系列处理器包含3个计算die,核心数量最多达到了128个。
内存带宽方面,至强6900P系列处理器拥有12通道的内存,内存规格支持DDR5 6400或者MRDIMM 8800,相比上一代实现了大幅提升,这使得至强6900P系列处理器的每个核心拥有了更加充裕的内存带宽,更加有利于核心性能的释放,从而在生成式AI、深度学习、机器学习、推理训练等场景中获得更好的表现。
此外,至强6900P系列处理器支持最多6条UPI 2.0链路(速率高达24 GT/s),96条PCIe 5.0或64条CXL 2.0通道以及504MB的L3缓存。
AMX加速器则在此前支持BF16和int8数据类型的基础上,引入了FP16的数据精度,这也为AI推理和训练提供了更多精度上的选择。
异构计算方面,至强6处理器作为英特尔首代支持CXL 2.0规范的处理器,不但极大地提高了内存利用率,也为未来内存扩展和内存池化奠定了基础。在实际的应用场景中,客户可以通过CXL NUMA节点模式、异构交织模式(Hetero Interleaved)和扁平内存模式(Flat Memory)三种模式实现内存的扩展。
热功耗方面,至强6900P系列处理器的TDP最高达到了500W,但对数据中心来说,重要的是实际的能耗比和核心密度的提升,所以只要实际能耗比在增加,这种增加单个处理器TDP来换取核心密度提升的方式并无不妥。
性能方面,与上一代处理器相比,至强6性能核处理器的性能实现了翻倍,并凭借更多的核心数量、双倍内存带宽、内置的AI加速功能,满足从边缘到数据中心再到云环境中的各种严苛AI挑战。由于采用模块化SoC架构设计,至强6性能核处理器可以凭借丰富的产品系列,为云服务提供商、OEM、ODM、ISV等提供高度的灵活性和可扩展性。
在云计算领域,英特尔至强6处理器在每路核心数、单核性能、每瓦性能方面,相比上一代处理器均有显著提升,可帮助云服务提供商有效降低计算成本。与第五代英特尔至强可扩展处理器相比,至强6处理器拥有多达2倍的每路核心数,平均单核性能提升高达1.2倍,平均每瓦性能提升高达1.6倍,同等性能水平下平均节省30%的TCO。同时,在数据中心常见的通用计算、数据和Web服务、科学计算和AI等工作负载中,至强6性能核处理器在性能和每瓦性能上,相比上一代处理器也有显著提高。
在AI领域,凭借具备完整宽度、特性最全的的AVX512指令集和已经打磨了三代的AMX加速引擎,对比AMD的96核心EPYC 4处理器,同样是96核心的英特尔至强6972P实现了断层式的4倍性能领先。
英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示,面对AI时代对更高质量和更多元化的算力需求,英特尔推出全新至强6性能核处理器。凭借强大的计算密度、领先的单核性能、更高的内存带宽和I/O以及出色的能效,至强6性能核处理器能够应对数据中心丰富多样的工作负载挑战。在推动基础设施创新的同时,英特尔亦持续从打造解决方案到构建行业统一标准等多维度,助力高能效数据中心发展。
生态建设与解决方案
生态建设多年来一直是英特尔的强项,今天除了发布至强6性能核处理器以外,英特尔也和一众生态伙伴分享了基于英特尔至强6性能核产品的最新解决方案,并分别从计算密度、内存带宽、数据处理、能效优化四个方面阐述了其卓越的性能表现。其中:
-浪潮信息联合英特尔及客户伙伴发布了国内领先的服务器计算模组设计规范(OCM),基于最新至强平台率先推出松耦合开源架构,满足多样化算力部署需求。
-阿里云方升架构协同英特尔至强处理器持续迭代演进,推出最新一代磐久计算型服务器,以及基于至强6性能核的第九代阿里云英特尔平台企业级计算实例产品。
-超聚变则带来了其首款支持CXL 2.0+的内存池,可通过灵活分配与共享内存以充分提升系统效能。
-火山引擎基于英特尔至强6性能核处理器进行了架构和性能优化,CPU核心数翻倍并采用双单路架构设计,使其第四代云服务器实例在保障稳定性的同时大幅提升了计算密度和应用性能。
-新华三与英特尔联合打造“G-Flow”油类单相浸没液冷技术,通过突破性设计大幅提高液体流速,在保持系统性价比的同时,提高整体冷却效率。
在最后的联合发布环节,浪潮信息、超聚变、新华三、中兴通讯和联想分别展示了基于英特尔至强6性能核处理器的新品,聚合力推动数据中心的算力升级。此外,在活动现场展区,来自OEM、CSP、ODM和ISV的众多生态伙伴也通过丰富的展品分享,展示了基于全新英特尔至强6性能核处理器打造的各种产品和解决方案,以高效节能的算力基础设施,满足广泛的行业需求。
英特尔市场营销集团副总裁中国区云与行业解决方案和数据中心销售部总经理梁雅莉对此表示,“作为算力的载体,数据中心在过去近20年中,通过不断地演进与重构见证和推动了科技的发展。英特尔通过平台和产品的迭代升级,不断优化数据中心架构。在算力需求日益多样化和海量化发展的当下,英特尔通过至强6性能核处理器的发布,与生态伙伴共同探索数据中心系统架构的升级,进一步释放算力价值。”
此外,针对数据中心所面临的能耗和散热挑战。英特尔也在发布会期间介绍了英特尔中国数据中心液冷创新加速计划,不仅携手行业伙伴突破油类单相浸没散热能力有限的技术难题,也进一步推动冷板式液冷整体解决方案验证,同时还联合生态力量推动UQD互换验证测试,从技术创新、构建统一行业标准两方面“双管齐下”,降低数据中心液冷使用成本、增强可靠性,为液冷技术的规模化应用保驾护航。
近几年来,在数据中心领域,英特尔因为核心数量的问题经常被外界所诟病,今天发布的至强6性能核处理器可以说是为数据中心市场打了一剂强心针,基于强健的x86基础架构底蕴和技术创新,至强6性能核处理器在性能表现方面相比上一代至强实现了显著的提升,和AMD Zen4 EPYC也是打的有来有回,再加上6月份发布的能耗比及其优秀的能效核处理器,凭借着广泛且开放的生态系统,英特尔可以说是重新回归了数据中心领域的王座。
(9034314)
亚马逊自研Graviton4芯片实测,比英特尔至强8488C快5%
IT之家 7 月 27 日消息,亚马逊于 7 月 15 日发布公告,旗下 AWS 上线基于自研芯片 Graviton4 的 Amazon EC2 R8g 实例,根据 phoronix 测试的结果来看,性能非常出色。
自研芯片 Graviton4
亚马逊于 2023 年 11 月发布全新 Graviton4 处理器,官方声称性能比前代提升 30%,内核数增加 50%,内存带宽增加 75%,可以帮助 Amazon EC2 云服务的各类工作负载提供最佳性价比和能效。这款处理器还对所有高速物理硬件接口加密来提高安全性。
测试选手
该媒体共测试了 5 个 AWS 示例,使用 Ubuntu 24.04 和 Linux Kernel 6.8 以及标准 GCC 13.2 编译器进行了测试:
Graviton4(r8g.16xlarge)
Graviton3(r7g.16xlarge)
Graviton2(r6g.16xlarge)
AMD EPYC 9R14(r7a.16xlarge)
Intel Xeon 8488C(r7i.16xlarge)
Graviton4 在全部测试中表现出色,在所有测试结果的平均值中排名第二,仅次于 AMD 的 EPYC 处理器,IT之家附上完整测试报告链接,感兴趣的用户可以点击深入阅读。
测试结果
测试结果与亚马逊对其处理器的宣传相吻合,Graviton4 处理器略优于英特尔至强处理器约 5% ,但 AMD 的 EPYC 处理器在整体性能上仍领先约 25%。
该媒体表示:
目前,搭载 Graviton4 的 Neoverse-V2 内核与 Intel Sapphire Rapids 内核在性能上旗鼓相当,在某些工作负载下甚至优于 AMD 第四代 EPYC。
当然,Graviton4 刚刚发布,未来几个月内将与 AMD EPYC Turin 和 Intel Xeon 6 Granite Rapids 展开竞争。
相关问答
至强服务器芯片,什么是至强服务器芯片?
共有四个系列:E56xx、X56xx、L56xx、W3680。其中有四核心、八线程的也有六核心、十二线程的。L代表60W以下的低功耗版;E代表80W的版本;X代表95W以上的版本。四...
至强处理器为什么便宜?
毕竟是服务器CPU,通常大家是接触不到,也买不起的,非常贵。但是海外有很多数据中心在被淘汰之后,会有大量的至强处理器以洋垃圾的形式进口到国内销售。因为便...
至强这个cpu如何?
靠谱。至强Xeon处理器不但有更快的速度,更大的缓存,更重要的是可以支持多达4路或者8路的SMP对称多CPU处理功能。Xeon处理器基于英特尔的NetBurst架构,有更高...
至强cpu优缺点?
至强Xeon处理器不但有更快的速度,更大的缓存,更重要的是可以支持多达4路或者8路的SMP对称多CPU处理功能。Xeon处理器基于英特尔的NetBurst架构,有更高级的网...
至强CPU怎么样?-JRiOcbr7sUM的回答-懂得
至强乃属于服务器用CPU,整体综合实力都很强大,但是价格很贵。如果便宜,那基本都是老款淘汰的至强处理器了。买了很不划算。不要轻信淘宝之类的网购...
intel至强CPU和酷睿I系列CPU有什么不同-ZOL问答
简单来说至强系列注重于多任务处理性能,对于单个任务处理能力相对有较大限制,而i系列则注重于桌面性能,对于单个任务能尽可能占用掉CPU资源比如说i5,i7配合高端...
至强x5550处理器好不好?大概多少钱?-ZOL问答
至强x5550处理器好不好?大概多少钱?服务器CPUIntelIntelXeonX5550讨论回...价格145左右,需要搭配X58芯片组的主板使用。如有不懂之处请,有帮助请采纳,谢...
intel至强CPU和酷睿I系列CPU有什么区别-Ms.Ji?的回答-懂得
主要区别在于:至强处理器的核心比酷睿的多;倍频比酷睿的多。如图:1.intel至强CPU:2.酷睿I系列CPU:具体数据如下:至强是服务器用的CPU,缓存大,稳定性...
至强CPU怎么样?
不错的,至强Xeon是英特尔生产的微处理器,它用于"中间范围"的企业服务器和工作站。在英特尔的服务器主板上,最多达八个Xeon处理器能够共用100MHz的总线而进行多...
至强w系列配什么主板?
可以上华硕X58芯片组的主板,例如华硕SaberToothX58就是一个不错的选择,这款主板参数如下:主芯片组:IntelX58;音频芯片:集成RealtekALC8928声道音......