问: 英伟达(NVDA)近期上攻$1000的高位后,多空分歧开始剧烈,不少人拿出当年互联网泡沫时Cisco的尖峰图做对比。 您怎么看?答: 但在大多数情况下,用旧数据来短期预测股市是意义不大的:因为变量太多,情况完全复刻的概率极低。但是,分析科技股一定是要分析其未来数十年的发展逻辑,而且这个逻辑是相通的。问: 但是,市面上就没几个人把英伟达的逻辑说清楚的。至少我没看到。答: 看清英伟达的逻辑确实相对门槛比较高,它至少有三层:- 总AI市场需求(TAM)够不够大?这个生意能赚多少年?
- 英伟达现在爆好的业务会不会昙花一现?大厂们完成硬件军备竞赛完成后不再需要采购了?
- 英伟达的护城河够深吗?未来竞争对手能抢走多少份额?
问: 我知道科技股巨头绝大多数有个特点,就是有所谓的“护城河”。但英伟达这个护城河是怎么回事,道上各种神仙妖魔经常是乱吹一气,实在不知道应该听谁的。答: 我一直这样认为,科技公司的护城河,大多是软硬一体的,这样就可以持续半个世纪以上。纯软件或纯硬件成功的公司肯定也有,但不影响我的核心观点。问: 您能给出一些例子吗?答: 我从过去50年每个十年分别找出个例子,来做一下说明。 1970年代最重要的软件技术是关系型数据库,我们简称SQL吧。SQL使得企业的信息化启动了,手写帐变成了电子账,带来第一个万亿级赛道。我们要提的这家软硬一体公司,就是IBM。IBM的工作,简单说,就是给企业用上SQL,配上IBM的主机。1980年代,大家都听过神奇CEO带着IBM大象跳舞,其实主要是职业经理人的自我吹嘘。所谓跳舞就是砍掉硬件转型服务,而事实是主机是IBM真正的护城河,它根本没被砍,装SQL的“服务”业务是市场爆炸需求,也不是职业经理人发明的。IBM主机业务50年经久不衰,我们大家的存款大多还是IBM主机管着。虽然很多人都以为IBM已经完蛋了,但它的股价其实现在是创新高的。 1980年代最重要的软件技术是图形界面,我们简称GUI吧。GUI使得PC爆发增长成为每个人的工具,这里的代表公司是WINTEL。微软和英特尔确实是两家公司,但由于两家是事实上PC标准的制定者而软硬件深度绑定。他们的成功也持续至今,虽然英特尔近几年碰到不少问题但在PC领域仍是领头羊。 1990年代最重要的软件技术是万维网,我们简称WWW吧。WWW中最重要的软硬件一体公司是思科(CSCO),思科从那时至今仍是互联网后台最重要的公司,我们如果除去2000年泡沫的尖峰,思科的股价其实也是稳步向上的状态。也就是说,和IBM类似,思科的核心生意从那时开始一直赚钱至今,只是这个生意没大家想象的那么大,换机频率比较低。思科曾有个巨大的失误,就是其终端路由器WRT54G错误地选用了Linux,因GPL协议的原因被迫公布了源代码,这导致所有公司一下子都会做普通路由器了。如果思科当时像苹果MacOS那样选FreeBSD,这个软硬一体恐怕还能多赚很多钱。 2000年代最重要的软件技术是虚拟化,也叫Hypervisor。这里面最出名的公司是VMWare,它的最核心产品其实是服务器底层(Bare-Metal)操作系统。VMWare的软件非常非常优秀,但它缺乏深度的硬件绑定自身难以成为超级巨头,反而被硬件公司买来卖去的。最终成功应用虚拟化做到软硬一体的公司,是亚马逊、谷歌和微软,他们使得互联网变成工作生活必须的基础设施,给你提供各种信息和商品。 2010年代最重要的软件技术是移动操作系统,iOS和Android。苹果做到iOS软硬件一体而赚走了手机业90%的利润,这里不用多讲吧。 2020年代最重要的软件技术显然是大语言模型,我们简称LLM。问: 您之前列的那些软硬件一体,都是奔着持续挣50年大钱的,我承认。但是LLM真的能和那些前辈相提并论吗?答: 答案是肯定的。这就是看多英伟达的第一层,而且我相信华尔街也达成了共识,所以才会疯狂追捧。 Hinton说,GenAI(LLM)标志了仿生智能(连接派)在与符号逻辑智能(符号派)的竞争中胜出。而这个胜出一下子为后面AI代替人的几乎所有事情画清了路线图,甚至人无法做的那些事机器如何做也都有了眉目。 黄仁勋说,人的DNA序列也是个语言,我们还不知道它是什么意思,形成的各种蛋白作用是什么,但LLM未来大概率可以告诉我们。这为未来的医学打开了一扇巨大的门。 简单说,过不了几年LLM就是任何人不可缺少的随身伴侣,普通人花十几年的巨额代价学外语学数理化都将变得没有意义。问: 停!你吹了半天LLM,可英伟达不是做LLM的呀,你不是说软硬件一体么,而且训练LLM的GPU,好多家都能做呢。另外,英伟达这几个季度业绩超预期,是各个大厂抓紧采购的结果,他们急需AI平台炼丹来追赶OpenAI等公司。等他们都采购一圈了,数据中心也建好了,英伟达的业绩也就不行了吧?答: 确实,目前是AI届的军备竞赛,先买够装备再说。从分析师给出的数据看,前两家大厂采购量最大,其它家还远远没到呢。目前暂时无法判断需求已经见顶,从英伟达指引看交货还成问题,这个军备竞赛至少还要持续一年。等到这轮军备到位了,更新换代也该到来了。因为目前的硬件还是存在明显的性能问题,我们看到炼GPT-4这种丹需要超过一年的时间。按黄老板的估计,未来十年AI算力会增加100万倍,这个有意思了,逼着大厂们不停地更新换代啊。这也就是黄老板说的,英伟达自己将和自己竞争。问: 那第二层我明白了,我们看第三层。这些算力的增长可不一定是英伟达独吞呀,英伟达的护城河到底有多深?我看CUDA被吹到天上去了,不就是些软件库么,我看竞争对手都有竞品了呀。AMD有ROCm,英特尔有oneAPI。答: 你有没有发现,你在网上很难找到真正对比评测的内容。为什么呢?因为他们和英伟达的差距比你的认知大得多的多。问: 我看到英特尔CEO Pat Gelsinger说:“我们认为CUDA护城河又浅又小。”硅仙人Jim Keller说,“CUDA就是沼泽地,不是护城河。”这些大咖明显看不上CUDA的嘛。答: 我得承认,你看到这些评论后,一定会产生CUDA没什么了不起的感觉。但事实上,他们正是用含糊的语气故意让你产生这种错觉。Gelsinger其实加了点解释,他认为CUDA只是训练有用,推理时就可以不用了,推理可以用英特尔AI处理器。Jim Keller说的沼泽地什么意思他没认真解释,他认为X86也是沼泽地。事实上,正是积累了超过十年的沼泽地,让竞争对手根本没办法抄。你知道怎么铺柏油路,但你不知道怎么搭建一片一模一样的沼泽地。就像微软的Office,设计和代码一团乱麻,但就是一种能前后兼容的沼泽地。问: 你说的还是不够清楚,像AMD这样已经有强大GPGPU的厂商,不需要抄CUDA,自己重新搞一套标准库不就好了,像新铺一个柏油路。答: 这就说到什么是英伟达的软硬一体了。事实上,15年前厂商们就在一起搞了一个叫OpenCL的计算框架,但因为市场太小各家又同床异梦,有bug又长期不解决,导致它现在半死不活。AMD搞CUDA的竞争平台ROCm也不是一天两天了,是七年多了,但是同样投入资源不够,各种问题拖到用户崩溃,导致用户基本都流失了。而英伟达,黄老板自称是个软件公司,软件工程师比硬件工程师多。问: 那也就是CUDA没有像样的竞争对手了? 英特尔正是看到OpenCL和ROCm都深陷泥潭,决定抽身出来新铺一个路,这就是oneAPI。客观地说,oneAPI确实志向高远,它试图囊括所有家的GPU,CPU,FPGA等做个高级抽象平台。问: 没听太明白。人家AMD一种硬件都搞不定,你搞各种硬件反而能搞定?答: 类比一下吧,英特尔搞的这个东西,有点像谷歌搞的安卓用Java,在各种厂商的不同硬件上都能跑;而CUDA像iOS只能在英伟达GPU上跑,但性能最优。英特尔收购了一家叫Codeplay的挺厉害的公司,目标是通过SYCL语言实现跨平台和各种可移植的库。但其挑战是,SYCL远不像当年Java那么流行而且有极其丰富的程序员资源。问: 明白了,那CUDA算是遇到挑战者了?答: 还远远没有。高性能计算需要完善的硬件层、驱动、集群、底层库和上层应用(PyTorch,编译器等)的深度绑定,CUDA没有一个短板。而其竞争对手除了最基本的GPU芯片性能类似,别的部分都遥遥落后,单一个驱动程序都bug百出。AMD的MI300虽然单机性能强,但并没有那么大的实战意义。这就是黄老板说的,他们的硬件白送,搞出LLM的成本都比英伟达高,因为各种错误时间耗不起。问: 你说的集群是什么意思?答: 炼丹超大型LLM,需要千颗以上的GPU协同工作,这种量级针对LLM的集群软硬件生态,目前只有英伟达独此一家。即使说到几颗GPU的小集合,英伟达都是遥遥领先,这就是我们看到的Hopper架构,GPU之间连接的NVLink和NVSwitch是英伟达私有技术,AMD用的PCIe并不能与之抗衡。H200首家采用的HBM3e,有恐怖的4.8TB/s带宽来有效突破内存墙。再过两天英伟达开GTC,不知道还会有什么东西拿出来吓人。问: 你真是英伟达吹啊。难道它就没什么弱点可以击破吗?答: 在美国的H1B工签抽签环境下,程序员是非常稀缺的资源。加上美国互联网业发达和基础教育薄弱,其程序员的缺口巨大。驱动程序和计算库这种低性价比的东西,美国程序员大多是不爱做的。 和美国形成鲜明对照的是中国,基础教育卷到发指,程序员资源如滔滔江水。我们看到,由于中美高技术脱钩,中国必然全力发展自己的新质生产力。那些AMD和英特尔正在苦苦挣扎的库都是开源的,我们只要投入足够、力出一孔,必然可以大幅度缩短和英伟达CUDA的差距。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。