AMD四核处理器巴塞罗那的深度分析
——
四年以后,尘埃终于落定,AMD在其为工作站和服务器设计的四核CPU中首次实现了K10微架构。不出所料,首次发布的是2GHz和1.9GHz版产品,2.5G将在“11月推出”。
AMD想要战胜Intel的地方其实概括起来只有三个词:
1. Front
2. Side
3. Bus
每一个核都可以单独钟控(AMD的术语:独立动态核技术)。每一个核都可以选择性的将无需工作的部分进行门控时钟处理以节省功耗(Coolcore技术)。核和内存控制器有两个独立的电源层(双动态电源管理)。
每个核专门配备128Kbytes的一级缓存,512Kbyte的二级缓存。四个核共享2Mbytes的三级缓存。
高效交叉开关使得四核都可存取两个72位宽的DDR2-667内存控制器,通过HyperTransport 2.0链路可以与其他CPU交互。
当比较AMD与Intel双核和四核结构时,我的重心在前端总线(FSB)上
。Intel CPU(还)不是单管芯的四核设计,相反,它们将两个双核堆叠在一个封装中;它的管芯内不含有内存控制器,相反,DRAM控制器由独立的核逻辑芯片组-北桥芯片提供;而且它们没有专用的CPU间互连通道(至少一年内不会有)。 这一切意味着Intel用来连接管芯与管芯之间,CPU与CPU之间以及CPU与芯片组之间的FSB会承载很多对时序敏感的关键数据。表面上看,这些特性会让Intel处于劣势,但是,考虑以下几点:
Xeon CPU的每一个双核管芯都有两个64Kbyte的一级缓存阵列(一对一),再加上4Mbyte的共享二级缓存,没有三级缓存。与巴塞罗那比较一下缓存的大小和类型,特别是一级对一级,二级对二级(注意一级缓存性能通常优于二级,二级快于三级)。
Xeon5300系列FSB有1066MHz和1333MHz两种,而至今Xeon 7300系列只提供了1066MHz的FSB。AMD最新四核Opteron产品线和之前基于K8微结构的双核处理器还另有两个特征:
芯片的虚拟化支持经扩展后包含有硬件的虚拟-物理地址转换加速器,而之前是速度较慢的软件转换;
AMD加强了每个核的浮点能力,从单指令64比特的FPU升级为双指令128bit的FPU。
首先看虚拟化,注意AMD用先前的3GHz双核CPU与2GHz的四核进行benchmark对比。虽然这并不反映芯片或制程的一个基本问题,但它还是反映出AMD期望四核的后续产品不仅能够从芯片的管脚角度还可以从功耗和热辐射方面做到直接替代。不考虑时钟速度的不同,考虑到新的芯片具有增强的虚拟化硬件异常分支指令和两倍的CPU核数量,在这样的条件下79%的虚拟化性能提升并不算出人意料。
Intel有NetBurst-to-Core微架构,AMD也试图改善功耗,但目前我还没有ACP的对比数据。在比较AMD与Intel的功耗时,要记得Opteron内含DRAM控制器,而Intel的Xeon没有。AMD也继续使用DDR2 SDRAM,而Intel采用Rambus-reminiscent串行接口方案FB-DIMM。有报告称在系统空闲或低负荷时,FB-DIMM比DDR2 SDRAM功耗高,而在系统高负荷时,FB-DIMM在每瓦性能和总功耗方面比较有吸引力。
对比一下AMD先后送给我的两个文档可以有以下发现:
AMD也玩Intel和其OEM伙伴Apple之间的“速度”游戏。"_rate"版的SPECint (整数)和SPECfp (浮点)按照系统中的CPU数目并行跑多个Benchmark程序,在AMD与AMD的SPECint比较中,虽然四核CPU主频有33%的降低,但四核是双核核心的双倍,所以50%的性能提升是再正常不过的。
AMD没有就SPECint做与Intel的比较,重心相应放在了SPECfp和其它浮点相关的测试。这反应出AMD在K8向K10的演进中将重心部分放在了每核的FPU上。
不出所料AMD做了很多核到核、CPU到CPU以及CPU到内存的Benchmark测试,以此来对比竞争对手Intel的共享FSB。
在其中一份文档中AMD做了其高端2GHz CPU与Intel 2.33GHz处理器的Benchmark对比,注意这款Intel产品并不是Xeon 53xx系列最高端的产品。
有些人已经拿到了基于四核Opteron的系统,虽然简短的测试不能说明什么问题,我还是在一些测评中发现了些问题:
四核可相互利用对方二级缓存和共享三级缓存在目前的测试中并没有比需要FSB交互的Intel Xeon系列在性能上有明显优势。部分上这与AMD三级缓存太长导致的延时有关。Intel的总缓存带宽好像也超过了AMD的三级缓存方案。
Intel在整型数性能上似乎还保有优势,同时,AMD加强的FPU在浮点数性能上也没有达到我和其他人的预期;
AMD不再依赖共享的FSB,交叉开关模式和集成的DRAM控制器以及低延时(与FB-DIMM)的DDR2 SDRAM的使用都使得Opteron在“流”类型数据处理上很有优势,因为它们需要不断读取系统主内存。
AMD值得怀疑的四核Opteron性能,加上其竞争性的定价,这都是我长久以来对AMD长期财务健康担心的缘由。
在Intel的大幅降价下,我想AMD会占据中等的市场规模。理想情况下,新结构的发布都会有一个较高的定价,代表着新芯片的附加值和其前期的低产量。但不幸的是,同Intel已经推出9个月的CPU相比,AMD没能提升价格,这样的话四核可以盈利吗?
现在我对AMD接下来几个月的举动比较感兴趣:
AMD会以怎样的速度开始2GHz产品的铺货;
AMD多久可以推出2. 5G以及更高速率的产品;
还会有哪些深层的测试;
AMD多久可以推出针对消费类市场的k10微架构
评论