大模型时代,AI芯片公司眼里的中国市场
有人说,在大模型时代,全球范围内真正能做大模型的只有两个国家,就是美国和中国。大模型需要足够大的人才、资本、技术和市场规模及密度,中国和美国是全球唯二具备这样规模的市场,长期机会非常大。
本文引用地址:http://www.amcfsurvey.com/article/202306/447280.htm在大模型还没出现之前,传统人工智能面临着碎片化问题,不同的应用场景有着不一样的需求。而随着大模型的出现,业界相信人工智能将为各行各业带来范式转变。
「大模型是有用的」已经成为共识,谁能在「信息史上第三个平台」上发光发热,成为行业内关心的重要话题。人们相信大模型有能力重塑所有行业,AI 芯片行业也不例外。作为算力行业的重要组成部分,芯片公司特别是 AI 芯片公司也已然开始摩拳擦掌。那么 AI 芯片公司怎么看待中国算力市场?又打算如何在中国市场打出差异化?
谁是大模型时代的「算力大户」?
大模型需要大算力,因此算力行业作为大模型的支撑行业也受到热议。中国算力市场规模大,同时也有着自己的产业特点。工信部数据显示,到 2022 年年底,中国算力总规模达到 180EFLOPS,存力总规模超过 1000EB,国家枢纽节点间的网络单向时延降低到 20 毫秒以内,算力核心产业规模达到 1.8 万亿元。
中国算力市场已经成长为全球第二大的算力市场,这样巨大的市场主要的参与者可以主要分为两类:电信运营商和科技公司。
2022 年,三大运营商算力规模超过 11.8EFLOPS。根据中国移动财报数据,2022 年中国移动对外可用 IDC 机架达到 46.7 万架,累计投产云服务器超 71 万台,净超 23 万台,算力规模达到 8.0EFLOPS。中国电信拥有 700 多个数据中心和 3,000 多个边缘 DC,IDC 机架达到 51.3 万架,算力规模达到 3.8 EFLOPS;预计「十四五」末达 16.3EFLOPS。中国联通 IDC 机架规模达到 36.3 万架,全年算力投资达到 124 亿元。从算力类型来看,三大运营商主攻底层网络。身为国家队,主导云网资源,乘着「东数西算」之风迅速扩张。
IDC 发布的《2021~2022 全球计算力指数评估报告》显示,全球计算力水平前三的行业分别是互联网行业、金融行业、制造业。整体来看,大模型时代,互联网成为大模型时代算力市场的主力军。而中国市场孕育了多家互联网巨头,面对上亿规模的用户,中国互联网公司的需求,会在大模型时代为中国算力市场带来新的挑战与机遇。
Graphcore 总裁,大中华区总经理卢涛认为,与被传统的三朵云占据的欧美市场不同,在中国既有很多优秀的云厂商,也有很多选择自建数据中心的大型互联网公司。在国外,即使像 Netflix(网飞)这样的大型用户,也没有选择自建数据中心。中国市场头部用户的自建行为对 AI 芯片公司提出了更加具体、更加多样的需求。
大模型时代人人都要「被集成」
大模型是人工智能的「集大成者」,然而身处其中的玩家却都想「被集成」。
头部大厂如华为、阿里也认为被集成是当下的最优解。「被集成」体现的是在算力市场中,身处赛道中的玩家都需要专心做好自己的核心业务。当大厂选择这样的策略,这也为赛道上的后起之秀留下了机会。
在中国,Graphcore 选择坚定地走「被集成」策略。Graphcore 在英国以及其他大中华区以外的地区正在尝试向云的形式转型,不以单一硬件为产品进行销售;而面对中国市场,Graphcore 选择仍以硬件作为公司的主打产品,坚定地走「被集成」策略。
「被集成」是另一种精益求精。以 IPU 为例,虽然这种产品在产业中还是「新概念」,但在中国这样巨大的市场,能够让客户满意仍要面对重重考验。因为中国的客户对产品也有着更高、更复杂的需求。中国互联网企业的一个产品可能会被应用在几亿用户的场景中,可以说这些公司对算力产品的使用是最深最透最广的。为这样的客户提供产品是一个「痛苦」的过程,但这样的过程也会打磨出经得起考验的产品。Graphcore 相信,从这个角度来看,中国市场可以让行业内公司的产品进步得更快。
追赶者的决心:聚焦与定力
产业相信,在大模型技术高速发展的时代,一系列伟大的公司会因此诞生,新的商业模式将被创造,进而产生新的世界。而这样的时代,会给芯片产业带来怎样的改变?是否能有新的 AI 芯片公司登上大舞台?
未来怎样的 AI 芯片能成为主流将与未来算法模型迭代的方式息息相关。目前整个人工智能技术的基础还是以人脑为启发的;如果是这样的形态,就需要未来的芯片能支持巨大模型,要求存储很大,存储很快。
行业瞬息万变,AI 芯片公司要积极拥抱变化。目前 Graphcore 的 IPU 在 AI 模型支持方面,已经实现对 GPT-2 XL 版本、GPT-J、Dolly 2.0、ChatGLM-6B(在使用中可以做到每个 token 3.5 毫秒)模型的支持。迅速实现对不同模型的支撑,也是一家 AI 芯片公司的竞争力。
行业的「后来者」如何在这样的市场中竞争?Graphcore 表示公司要做的是两件事:一是「聚焦」,二是「定力」。
在大模型时代,寻找属于自己的价值点,是所有想分大模型一杯羹的公司的第一个作业。聚焦了不一定马上会有结果,结果的反射弧可能会比较长,需要一定时间,这时候就需要有定力。在聚焦和有定力的情况下存活下去,直到聚焦和定力产生了结果,最后实现突破。
评论