英伟达爆出又一重磅产品:含256个GPU的AI超级计算机!
5月29日,英伟达在2023台北电脑展大会上发布了多项重磅消息,其中最引人注目的是其Grace Hopper超级芯片已经全面投产。这些芯片是英伟达新推出的DGX GH200人工智能超级计算平台和MGX系统的核心组件,它们专为处理海量的生成型人工智能任务而设计。
本文引用地址:http://www.amcfsurvey.com/article/202305/447181.htm新型超级计算机:DGX GH200
英伟达宣布推出搭载256颗GH200 Grace Hopper超级芯片的新型DGX GH200人工智能超级计算机。新的DGX系统拥有更大的内存容量和更大规模的模型能力,据悉DGX GH200的内存储量将是英伟达目前DGX A100系统的近500倍。
自去年年底OpenAI发布ChatGPT以来,生成式人工智能(AIGC)就成为热度居高不下的新趋势,该项技术需要通过超强算力来创建文本、图像、视频等内容。而芯片巨头英伟达所生产的人工智能芯片对该领域至关重要,计算能力方面的突破将使得AIGC应用再次获得巨大提升。
英伟达CEO黄仁勋在COMPUTEX 2023的主题演讲中表示,“DGX GH200人工智能超级计算机,集成了英伟达最先进的加速计算和网络技术,以拓展人工智能的前沿。”
英伟达预计,其新型超级计算机将允许开发人员为人工智能聊天机器人以及复杂的算法构建更好的语言模型,并创建更有效的欺诈检测和数据分析。有海外知名媒体对此评价道,英伟达的新人工智能超级计算机将改变“游戏规则”。
超强算力
Grace Hopper超级芯片是英伟达开发的基于Arm架构的CPU+GPU集成方案,它将72核的Grace CPU、Hopper GPU、96GB的HBM3和512GB的LPDDR5X集成在同一个封装中,共有2000亿个晶体管。这种组合提供了CPU和GPU之间惊人的数据带宽,高达1TB/s,为某些内存受限的工作负载提供了巨大的优势。
DGX GH200的细节还不太清楚,但已确认英伟达使用了一种新的NVLink Switch系统,包含36个NVLink Switch芯片将256个GH200 Grace Hopper芯片和144TB的共享内存连接成一个单元。
DGX GH200人工智能超级计算平台是英伟达针对最高端的人工智能和高性能计算工作负载而设计的系统和参考架构,目前的DGX A100系统只能将8个A100 GPU联合起来作为一个单元,考虑到生成型人工智能的爆炸式增长,英伟达的客户迫切需要更大、更强大的系统。
DGX GH200就是为了提供最大的吞吐量和可扩展性而设计的,它通过使用英伟达的定制NVLink Switch芯片来避免标准集群连接选项(如InfiniBand和以太网)的限制。
英伟达CEO黄仁勋表示GH200芯片为“巨型GPU”,这是英伟达第一次使用NVLink Switch拓扑结构来构建整个超级计算机集群,称这种结构提供了比前一代系统高出10倍的GPU到GPU和7倍的CPU到GPU的带宽。
它还设计了提供比竞争对手高出5倍的互连功耗效率和高达128TB/s的对分带宽。该系统有50英里的光纤,并且重达4万磅,但是呈现出来就像一个单一的GPU。英伟达表示256颗Grace Hopper超级芯片将DGX GH200的“AI性能”提升到了exaflop(一百万万亿次)。
英伟达将把DGX GH200的参考蓝图提供给其主要客户谷歌、Meta和微软,并且还将把该系统作为云服务提供商和超大规模数据中心的参考架构设计。该系统预计将于2023年底投入使用,目前英伟达没有提供价格。
英伟达自己也将部署一个新的英伟达Helios超级计算机,由四个DGX GH200系统组成,用于自家的研发工作。这四个系统共有1024个Grace Hopper芯片,并且用英伟达的Quantum-2 InfiniBand 400Gb/s网络连接起来。
5月25日,英伟达公布了明显高于华尔街预期的季度营收预测,此后该公司股价在一天内飙升24%。季度报告表明,营收的上涨主要受惠于云计算平台和大型科技公司对GPU芯片的需求。
评论