高性能计算的金字塔式进化
刚刚更新的HPC TOP500榜单再次点燃了人们的激情。对专业人士来说,这份来自国际超级计算大会的权威成果预示着高性能计算的新风向。即便是普通读者,这份榜单也绝非无关紧要,计算能力跃升意味着我们能更快地找到石油、更准确地预测天气和自然灾害、更清楚地了解生命的奥秘……
本文引用地址:http://www.amcfsurvey.com/article/85514.htm从科研向商用普及
相较以往,此次公布的榜单似乎动静更大些。这半年来,计算能力再上了一个数量级,考量依据首次引入能效数据、四核快速成为绝对主流,集群、Infiniband等技术主题词的优势也进一步扩大,英特尔更是以其IA架构(至强与安腾)占据75%的份额理所当然地拔得头筹。众多表象背后,我们试图聚焦于平台及生态系统层面,榜单背后还有哪些值得我们去关注?
高性能市场是典型的金字塔结构,最下端的基石部分是庞大的工作组级,系统一般为6~64个节点,中间部分就是所谓的行业大单,一般有256~512个节点,甚至更大。顶部技术最尖端,也最吸引眼球,它一定是大规模并行架构方面的创新者和推动者,但份额极小。
英特尔服务器产品经理顾凡表示,高性能计算市场的热点集中在两端,一个是顶端的技术突破,拥有更大的计算能力去满足尖端领域的性能需求;另一个是底端的应用普及,它的关键在于提供商要能把突破性技术以更低的成本向下灌输。金字塔的中间部分是最为成熟的,标准化的集群架构非常普及且标准化,未来只是应用刀片解决方案之类的提高能效的问题。
从对上榜系统用户的统计上看,HPC从科研走向商用化的趋势非常明显,关注点也由过去的追求性能到解决问题的高生产力。以中国为例,我国内地上榜的12套系统中有6套用于石油行业的勘探作业。另6套高性能计算系统分别为电信、气象、地理和物流等行业用户采用。相比全球发展来看,中国目前仍有多个行业尚未开启其高性能进程,如金融行业,华尔街在其风险模型的预测方面应用高性能计算,在做投资产品组合时快速响应,降低风险,抢占先机;再比如生命科学领域,高性能计算也在高速成长。这些都是中国亟待开垦的高性能计算沃土。
软硬件的协同力量
此次TOP500上榜系统的总体计算能力获得了空前提升,本次榜单中排名最后的系统性能在上一次榜单公布中还可以名列第200名。这样的性能提升与采用多核处理器密不可分。
在系统采用的处理器中,刚发布7个月的英特尔至强5400是最耀眼的明星,它同时也推动了四核成为HPC的绝对主流。至强5400被161台系统采用,占总数的32.20%,同时,在首次引入的能效考量体系中,也以最高为265Mflop/s/W的表现位居x86架构系统的首位。这样的表现主要归功于45nm制造工艺给其绝对性能和能效带来的提升。顾凡表示,待Nehalem微架构推出,内存带宽等方面的改善将使基于该架构处理器的系统获得更大的性能提升,能效也将进一步提高。
有了先进的处理器,性能却未必一定会提升很高,因为软件上还存在着巨大的调优空间。英特尔在HPC生态系统中,就从事着这样的软件支持工作。其实,软件与硬件可谓英特尔的左右手,它在软件方面有大量调试工具,针对高性能计算有专门的软件包,如编译器、数学函数库等工具,这些是帮用户把高性能计算应用好的核心。英特尔所做的工作就是针对用户的应用软件做优化,解决并行瓶颈,以更好地应用线程并行,这样才能把整个集群的能力激发出来,甚至会提高数倍的整体性能。
记者了解到,英特尔设在美国的高性能计算中心由软件与解决方案事业部管理,其职责是帮助HPC解决方案供应商、甚至最终用户做分析与调优,他们最早接触英特尔的高性能产品,有足够的技术实力在新一代架构上进行调优。
蓄势千万亿数量级
IBM基于CELL和皓龙处理器的Roadrunner此次位列榜首,并将计算数量级突破了千万亿次(1 Petaflops)。同样是冲击最高端,英特尔的产品规划与技术准备的情况如何?混合架构是否是冲击千万亿次计算的必经之路?
英特尔高性能计算方案架构师张晓军与记者进行了交流。他认为,在最高端领域,英特尔正稳步走在正确轨道上。“英特尔在高性能计算产品线上的布局非常完整,既有服务于集群架构的至强,也有服务于大内存容量需求的安腾,未来高端的还有Many Core(众核)架构去服务HPC的金字塔尖部分。”他列举了两个重要事件佐证观点,一是4月28日,Cray宣布联合英特尔共同开发下一代高性能计算机;二是NASA(美国航空航天管理局)与英特尔、SGI宣布将共同为NASA在2009年前开发出峰值性能为千万亿次的计算系统,2012年将这一数字提高到万万亿次,服务于NASA航空航天的研究包括气象预测的研究。“这些重量级的合作伙伴为什么会选择与英特尔长期合作?这表明他们看到并认可英特尔在HPC领域未来长远的发展蓝图。” 张晓军表示。
在技术层面,英特尔2006年就开始做单芯片的万亿次研究,它将成为千万亿次计算的基石组件。张晓军介绍说,英特尔已为此开展了100多个研究项目,去探索在未来的超大规模并行计算中,除了处理器之外,在服务器平台、内存架构、高带宽I/O、软件编程等各个方面遇到的难题,都以研究项目覆盖解决。“英特尔坚信,高性能计算一定会走向多核化,我们更倾向于未来更轻量的小核实现并行化,这个核的指令集、计算、管道都不用那么复杂,这也会带来能量节省。”
谈及混合架构,张晓军认为,加速器尽管对性能提升的影响较大,但却只适用于应用的特定部分,对其他部分意义并不大。而对于大多数用户的实际应用来说,他们首先要考虑软件调优带来的大幅度性能提升,这才具有更为普遍的意义。张晓军表示,轻量小核才是未来的必经之路。“当然,只靠多核也不能走向千万亿次,还需要有能力做平台研发和软件方面的尝试和突破,这正是英特尔的核心价值所在。”
评论