揭秘太湖之光:纯国产如何称雄TOP500?
第1篇:超算界的角斗场:TOP500是什么?
本文引用地址:http://www.amcfsurvey.com/article/201607/294145.htm1946年,由美国军方定制的电子计算机“ENIAC”面世,当时的这个“大家伙”每秒可执行5000次加法或400次乘法运算。经过了70年的发展,超算的运行速度已经达到亿亿次/秒级别。在今年6月的ISC 2016上,TOP500公布了新一届世界冠军:神威·太湖之光。有人不禁会问,这款超算究竟有何能力超过天河二号?国产处理器申威26010,又是怎样的秘密武器?
神威·太湖之光
超算界的角斗场:TOP500
自1993年以来,国际TOP500组织每年都会按照Linpack测试性能公布全球已部署的前500台超算,每年会有两次排名,旨在促进超算领域的交流和合作,推广应用。由于在2002年之前,中国HPC(高性能计算)未曾向国际申报过Linpack结果,因此没有被列入TOP500。后来,随着相关机构陆续开放测试,中国开始在国际超算市场崭露头角,迅速成为前10名的常客。
Linpack最早在1974年4月被使用,是当前最流行的用于测试高性能计算机系统浮点性能的基准,通过超算求解N元一次稠密线性代数方程组的方式做出评估。Linpack测试包括Linpack100、Linpack1000和HPL。其中,HPL被称为高度并行计算基准测试,是针对现代并行计算机提出的测试方式,应用范围更广。
计算峰值是衡量计算机性能的一个重要指标,所谓的浮点计算峰值分为理论值和实测值,前者是计算机理论上每秒能完成浮点计算的最大次数,主要由CPU主频决定,后者是Linpack测试值,即在计算机上运行Linpack测试程序,通过一系列调校得到的最优测试结果。
在德国法兰克福举行的第47届国际超算大会上,一串带有中国特色的英文“TaiHuLight”成了全场焦点,它的官方名称是“神威·太湖之光”。这款超算以93Petaflops的Linpack峰值性能力压天河二号,领跑TOP500,与它一起出名的,还有国产处理器申威26010。值得一提的是,中国上榜的HPC数量(167台)也首次超过了美国(165台)。
太湖之光登顶TOP500
除了排在前两位的太湖之光和天河二号,第四至十名的超算依次为泰坦、Sequoia红杉、日本K京、Mira、Trinity、Piz Daint、Hazel Hen和Shaheen II。根据官方的说法,中国是继美国、日本之后,全球第三个采用自主CPU建成千万亿级别超级计算机的国家。
作为曾经的TOP500六冠王,这里也有必要提一下天河二号,其由国防科大研发,落户在广州超算中心,搭载英特尔Xeon处理器,运行的是基于Linux的麒麟系统,创新性地采用了异构融合体系结构。天河二号的计算节点能耗约为18兆瓦,加上散热系统的整体能耗在20兆瓦以上。
第2篇:太湖之光首秀夺冠 软硬件实现国产化
初识“太湖之光”
事实上,今年的ISC并非是神威家族的首秀,2011年曾经有一个神威蓝光系统,被安装在济南的国家超级计算中心,当时在TOP500上排名第14,所使用的申威SW1600是第三代16核芯片。上线五年之后,在863计划的支持下,中国国家并行计算机工程技术国家研究中心(NRCPC)推出了更强大的申威SW26010处理器,帮助太湖之光夺取了冠军。
太湖之光搭载申威26010众核处理器,运行速度超过10亿亿次/秒,峰值性能12.54亿亿次/秒,持续性能达到9.3亿亿次/秒,功耗比达到每瓦特60.51亿次运算。与天河二号相比,持续计算速度提升了近3倍,测试功耗却更低(15371KW,天河二号为17808KW)。在Linpack测试中,太湖之光用4个小时就完成了天河二号20多个小时才能完成的运算任务。
申威26010处理器,主板为双节点(图片来自Jack Dongarra)
太湖之光的整机效率达到74.16%,相比之下泰坦为65.19%、天河二号为55.83%,这在性能愈强、规模愈大的情况下,是很不容易的。性能功耗比方面,太湖之光的成绩为6G/W,泰坦为2.143G/W,天河二号为1.95G/W。此外,太湖之光在Green500也跻身三甲,考虑到排在前两位的超算搭载的是低功耗英特尔E5,因此这一成绩值得肯定。
整体来看,太湖之光的架构应该是沿用了蓝光的MPP(大规模并行处理)分布式方案,更符合传统的HPC应用,效率更高。太湖之光由40个计算机柜组成,每个机柜有4个SuperNode(256个节点组成),共拥有40960个节点,每个节点单CPU有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GB DDR3-2133。
太湖之光机柜组成(图片来自Jack Dongarra)
评论