英特尔第五代至强处理器首次亮相:Emerald Rapids基准测试
英特尔第五代至强可扩展处理器:Emerald Rapids在各种数据中心工作负载中进行测试
本文引用地址:http://www.amcfsurvey.com/article/202401/454808.htm最近,英特尔在纽约纳斯达克举行了“AI无处不在”活动,公司在活动中推出了其面向数据中心的第五代英特尔至强处理器以及基于Meteor Lake的英特尔酷睿Ultra处理器,供笔记本电脑和其他小型设备使用。我们很幸运地在活动前一天与一些英特尔专家一起进行了直播,讨论了英特尔酷睿Ultra系列处理器的一些细节,建议您在有空的时候查看。在那次直播中,我们首次独家看到了一些酷睿Ultra基准测试,并随后对基于酷睿Ultra的笔记本电脑进行了全面评估。
在这里,我们将讨论新的英特尔第五代英特尔至强处理器,代号Emerald Rapids。第五代英特尔至强处理器是Sapphire Rapids的演变,我们在今年早些时候进行了评估,提供了许多细微的改进和改进,以增强功耗效率和性能。
第5代至强可扩展处理器采用与基于Sapphire Rapids的第4代兄弟相同的核心微体系结构,它们使用相同的英特尔7工艺制造,而且它们还与相同的插槽和平台兼容。因此,几乎所有英特尔的合作伙伴都可以迅速过渡到第5代至强可扩展处理器的服务器产品。这些新处理器受益于英特尔制造过程的又一年的改进,并采用了一些对固件、封装和芯片设计进行的调整,以提高性能和效率。
第4代至强处理器的核心数最多为60个,而第5代至强可扩展处理器每个CPU最多有64个核心。这些更新的处理器还配备了一个经过优化的内存控制器,与DDR5内存兼容,运行速度高达5600MT/s。对于目前考虑购买新服务器的IT决策者而言,Emerald Rapids升级的缓存配置可能是最有趣的。在堆栈的顶部,一些第5代至强可扩展处理器型号,采用双32核心XCC瓷砖,将具有约3倍的LLC(最后一级缓存),总量为320MB。许多数据中心工作负载从靠近处理器核心的大型缓存中获益良多,因此这次独立升级可能对英特尔的一些客户来说非常重要。第5代至强可扩展处理器还配备了速度高达20GT/s的UPI 2.0链路,并支持英特尔的信任域扩展,硬件支持的可信执行环境。
第5代至强可扩展处理器的另一个更新是对CXL类型3内存的支持,采用Compute Express Link 1.1。CXL Type 3设备可以通过CXL接口扩展系统的主存。当然,第5代至强可扩展处理器还具有最多12通道本地内存支持(与第4代至强处理器相似)。12通道DDR5内存和CXL Type 3附加设备的组合,可以用于扩展容量或增加带宽,以实现大型内存数据库和其他大数据工作负载,或虚拟机扩展。
与基于Sapphire Rapids的第4代至强处理器一样,第5代至强处理器采用多个瓷砖配置。顶级的“XCC”处理器采用两个瓷砖芯片(每个瓷砖最多32个核心,总共64个核心)。 “MCC”第5代至强使用单片块设计,最多32个核心(类似于第4代)。而“EE LCC”至强处理器也采用单片块设计,最多20个核心。
从Sapphire Rapids上的XCC处理器的四个瓷砖切换到Emerald Rapids上的两个较大的瓷砖,使缓存大小和功耗效率得以提升。这也导致了一些延迟的改善。当数据穿越瓷砖时,会有性能和延迟影响,而在Emerald Rapids上,这种影响和性能变异被最小化。最大处理器的封装也相对简化,并且需要较少的EMIB互连。
切换到XCC第5代至强可扩展处理器上的双瓷砖改变了对各种集群模式的支持。而第4代至强处理器支持SNC(子NUMA集群)在SNC4、SNC2和Quad模式下,第5代至强支持SNC2或Hemi(半球模式)。开箱即用的默认配置也是不同的。基于单个瓷砖的MCC第5代至强处理器保留对第4代至强处理器相同模式和默认配置的支持。
使用较少的EMIB互连以及对互连频率的一些调整,一些制造成熟度,以及对新增强的活动空闲模式的支持,使第5代至强处理器在功耗效率方面与第4代处理器相比实现了显著的改进。在空闲时,功耗可以降低高达100W,而在低服务器利用率期间还有额外的改进。
第5代至强处理器提供的新的优化电源模式可以在利用率低于40%的情况下将每个插槽的功耗降低高达110W。第5代至强处理器对五个不同的Turbo级别具有改进的Turbo比率,最终减少了在使用AVX512或AMX指令时的频率惩罚。
较低的功耗,结合增加的Turbo频率、更多的高速缓存和对更快内存的支持,使第5代至强处理器的性能每瓦得到了显著提高。
我们还应该迅速提到一下Xeon D系列的一些更新。新的Xeon D-1800和Xeon D-2800系列处理器与现有平台兼容。将推出12个新型号,最大核心数每个CPU增加到22个核心。对于网络/边缘应用的低功耗部分,将提供更高的核心数。70W型号的核心数从4个增加到8个,几乎将这些芯片的计算资源翻倍。这些芯片还增加了对英特尔Speed Select Technology - Turbo Frequency(英特尔SST-TF)的支持,该技术提供了将Turbo频率的优先级分配给特定核心的能力。Xeon D-1800系列还获得对双100Gb以太网连接的支持。
Xeon E-2400系列处理器也进行了一些更新。Xeon D-2400处理器将具有多达8个Raptor Cove核心,最大频率超过5.5GHz。它们还转向了一个新的插槽,并采用DDR5内存,支持高达4800MT/s的速度。PCIe通道配置(PCIe 3与PCIe 4)、DMI链接数量以及支持的USB 3.2 Gen 2.2端口的最大数量也进行了一些更改。
基于Emerald Rapids的第5代至强处理器的所有变化将导致性能或效率的提高,或者在工作负载方面都有所提升,这取决于具体情况。因此,对于仍在使用旧平台的客户来说,这些处理器代表了一次重要的升级。
4代至5代至赛扬处理器,Xeon处理器都配备了一系列加速器,以提高特定工作负载的性能,远远超出CPU核心本身的能力。这些加速器的种类包括:
Intel高级矩阵扩展(Intel AMX)
Intel数据流加速器(Intel DSA)
Intel内存分析加速器(Intel IAA)
Intel动态负载平衡器(Intel DLB)
用于vRAN的Intel高级矢量扩展(Intel AVX)
Intel高级矢量扩展512(Intel AVX-512)
Intel QuickAssist技术(Intel QAT)
Intel加密加速
与第4代硅片一样,英特尔提供其按需服务,允许客户根据需要扩展处理器的加速器功能。英特尔认为按需服务的灵活性为客户增添了价值,因为他们无需为可能不使用的加速器支付额外费用,并且可以在以后根据软件利用加速器的可用性增加功能。然而,这一观点的反面是客户可能会拥有系统中处于休眠状态的强大硅片。
总体而言,英特尔发布了超过30款第5代Xeon SKU,这与上一代相比是一个显著的减少。在给定型号中可用的加速器取决于芯片的预定段以及它在堆栈中的位置。有了这些,让我们看看这些新处理器的性能如何...
评论