Meta 首次披露自研 AI 芯片:专供内部使用
北京时间 5 月 19 日早间消息,据报道,Meta 公司开发了一些定制电脑芯片来帮助其执行人工智能和电子游戏任务,该公司本周首次与外界沟通了这些产品。
本文引用地址:http://www.amcfsurvey.com/article/202305/446742.htm这家社交媒体巨头在本周早些时候首次披露了该公司的内部芯片项目,此后又在周四晚间的虚拟活动上探讨了他们对人工智能技术基础架构的投资。
Meta 此前宣布今年为“效率之年”,不仅裁员至少 2.1 万人,还大幅压缩各种成本。在此之后,投资者一直在密切关注 Meta 对人工智能及相关数据中心硬件的投资。
尽管对一家公司而言,自主设计和开发电脑芯片的成本十分高昂,但 Meta 基础架构副总裁亚历克西斯・博乔林(Alexis Bjorlin)表示,Meta 相信,只要能提高公司业绩,便可证明这笔投资的意义。该公司还一直在调整其数据中心的设计,以便将更多精力集中在具有能耗效率的技术上,比如液冷技术和减少过热。
其中一款名为 Meta 可扩展视频处理器(MSVP)的电脑芯片可以处理视频,并将其传输给用户,同时减少能耗。博乔林表示,“没有任何商用产品”可以像 Meta 渴望的那样高效地处理和传输每天 40 亿段视频。
另外一款处理器则是该公司的 Meta 训练和推理加速器(MTIA)家族中的首款芯片,其目的是帮助 Meta 处理各种专门的人工智能任务。新的 MTIA 芯片专门处理“推理”,也就是利用已经训练好的人工智能模型做出预测或采取行动。
博乔林表示,新的人工智能推理芯片有助于加强 Meta 的推荐算法,这种算法可以决定用户的信息流中显示哪些内容和广告。她拒绝回答这款芯片的制造商,但一篇博文透露,该处理器“采用台积电的 7 纳米工艺制造”,表明这款处理器由台积电代工。
博乔林还表示,Meta 为其人工智能芯片家族制定了“好几代路线图”,包括用于训练人工智能模型的任务,但她拒绝提供除新款推理芯片之外的更多细节。之前有报道称,Meta 取消了一个人工智能推理芯片项目,并启动了另外一个项目,但却要到 2025 年才能推出具体的产品。博乔林拒绝对此置评。
由于 Meta 并未像 Alphabet 和微软一样出售云计算服务,所以该公司没有太大动力公开讨论其内部数据中心芯片项目。
“看看我们分享的内容,这是我们首批开发的两款芯片,肯定能够借此一窥我们在内部从事的项目。”她说,“我们没有宣传这些事情,也不需要宣传,但你知道,全世界都很感兴趣。”
Meta 工程副总裁阿帕纳・拉马尼(Aparna Ramani)表示,该公司的新硬件是为了与其自主开发的 PyTorch 软件高效配合,后者已经成为第三方开发者开发人工智能应用时最常用的工具之一。
这款新硬件最终可以用于执行与元宇宙相关的任务,比如虚拟现实和增强现实,还能用于新兴的生成式人工智能技术。生成式人工智能是一种统称,指的是能够创造有吸引力的文本、图像和视频的人工智能软件。
拉马尼还表示,Meta 为该公司的程序员开发了生成式人工智能编程助手,帮助其简化软件开发和运营过程。这款新的助手类似于微软 2021 年在人工智能创业公司 OpenAI 的帮助下推出的 GitHub Copilot 工具。
除此之外,Meta 还宣布,该公司的超级计算机 Research SuperCluster(简称“RSC”)已经进入到第二阶段,也就是最后一个阶段。这台超级计算机包含 1.6 万个英伟达 A100 GPU,Meta 使用这台超级计算机训练其 LLaMA 大语言模型及其他技术。
拉马尼表示,Meta 依然坚持自己的信念,希望通过为开源技术和人工智能研究做出贡献来推动科技领域的发展。该公司透露,其最大的 LLaMA 大语言模型 LLaMA 65B 包含 650 亿个参数,使用 1.4 万亿个令牌训练。令牌指的是用于训练人工智能的数据。
OpenAI 和谷歌等公司均未公开披露各自大语言模型的相似指标,但本周有媒体披露,谷歌的 PaLM 2 模型使用 3.6 万亿个令牌,包含 3400 亿个参数。
与其他科技公司不同,Meta 将其 LLaMA 大语言模型发布给研究人员,使之可以研究这项技术。但 LLaMA 大语言模型随后被泄露给了更多人,使得许多开发者在自己的应用中整合了这项技术。
拉马尼表示,Meta“仍在考虑我们所有的开源合作,当然,我想重申,我们的理念仍是开放科学和交叉合作。”
评论