AI芯片再出新性能怪兽 Tesla V100凭什么要价百万
据国外媒体VentureBeat报道,英伟达CEO黄仁勋昨天发布了一款针对人工智能应用的雄心勃勃的新处理器:Tesla V100。
本文引用地址:http://www.amcfsurvey.com/article/201705/359138.htm该新芯片拥有210亿个晶体管,性能比英伟达一年前发布的带150亿个晶体管的Pascal处理器强大得多。它是一款很大的芯片——815平方毫米,大小约为Apple Watch智能手表的表面。它拥有5120个CUDA(统计计算设备架构)处理核心,双精度浮点运算性能可达每秒7.5万亿次。
作为全球最大的图形芯片和AI芯片厂商,总部位于加州圣克拉拉的英伟达在加州圣何塞举行GPU技术大会,并发布了上述产品。
黄仁勋称Nvidia总共投入了30亿美元来打造这款产品。黄仁勋在发布这款产品时显得非常激动,称Tesla V100的研发是一项几乎不可能完成的任务,令人难以置信。
接下来,黄仁勋通过一系列视频及游戏展示了Tesla V100怪兽级的性能。那些曾经在Titan X上需要数分钟才能处理完成的任务,在Tesla V100上只需要花数秒就能完成。
此外,基于8块Tesla V100搭建的DGX-1也开始预售,价格为149000美元(合100万人民币),预计在今年第三季度交付。
在介绍该款芯片之前,黄仁勋谈到了AI近年的发展史。他指出,深度学习神经网络研究大约5年前开始带来成果,那个时候研究人员开始利用图形处理器(CPU)来处理数据,同时利用它们来快速训练神经网络。自那时起,深度学习技术呈现加速发展。今年,英伟达打算培训10万个开发者使用该项技术。
Tesla V100另称为Volta,针对深度学习而打造,Tensor性能可达每秒120万亿次浮点运算。它能够每秒传输300GB的数据,速度相当于时下其它处理器的20倍。该款芯片由三星代工生产。
该芯片针对深度学习训练的Tensor浮点运算性能达到去年发布的Pascal处理器的12倍。这种处理速度很有必要,因为深度学习算法的进展令人惊叹。
2015年,微软打造了一个名为ResNet的深度学习项目,该项目非常复杂,需要每秒7百亿亿次浮点运算的处理能力。百度2016年打造的Deep Speech 2 AI需要每秒20百亿亿次浮点运算的处理能力,谷歌2017年打造的NMT则需要每秒105百亿亿次浮点运算的处理能力。
微软正在开发一个新的ResNet版本,ResNet会同时使用64个Tesla V100芯片来进行处理。目前还不清楚Tesla V100批量出货的时间。
评论