当地时间3月16日,英伟达GTC大会在圣何塞SAP中心召开。英伟达CEO黄仁勋主题演讲开始前2个小时,会场的一半座位就已经坐满了人。面对如同超级碗般的现场气氛,黄仁勋一上台就开了个玩笑,提醒观众称,这是一场科技会议。
今年现场参加英伟达GTC大会的有3万多人,有1000多场涉及AI基础设施、推理、机器人等领域的会议。黄仁勋在演讲现场反复提到,英伟达正在努力展开协同设计和垂直整合,以及与上下游的合作,同时也涵盖了有关太空计算、自动驾驶等业务的信息。除了在地面数据中心使用的芯片和机架,黄仁勋还公布了英伟达的多个开源模型和新的太空计算模块。
新芯片亮相
Rubin是英伟达当前正着力推动上市的芯片平台,此前在CES上,黄仁勋已介绍了Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换机6颗芯片,此次Groq 3 LPU首次亮相。据介绍,Groq芯片正在全力生产,下半年将发货。Groq芯片由三星代工生产。
关于Rubin平台中的CPU芯片,此次英伟达方面也做出介绍,称这是全球首款专为智能体AI和强化学习打造的处理器,效率是传统机架级CPU的两倍,目前计划部署的云服务提供商包括阿里巴巴、字节跳动、Cloudflare等。
至此,Rubin平台的芯片扩充至7颗,此外还包括5个机架,共同组成一台AI超级计算机。5个机架中,Groq 3 LPX机架为智能体系统低延迟和长上下文需求设计。据介绍,Groq 3 LPX与Rubin CPU和GPU一起使用可将每兆瓦推理吞吐量提高35倍,有望使万亿参数模型推理的收入提高10倍。LPX机架配备256个LPU,有128GB片上SRAM和640TB/s扩展带宽,将在今年下半年集成到下一代Vera Rubin AI工厂中。
黄仁勋表示,英伟达已经搭建起一套供应链,每周可以生产数千个Rubin系统,基本上用于吉瓦级数据中心。
Rubin之后的架构还在进化。在现场,黄仁勋还展示了Rubin之后的下一代架构Rubin Ultra,称Rubin Ultra有一个全新的机架,新的NVLink将连接144个GPU。
两大芯片平台将带来1万亿美元收入
GTC大会中的一个高潮是黄仁勋对AI芯片收入的判断。
“去年这个时候,我看到2025年至2026年来自Blackwell和Rubin的5000亿美元订单收入,这是一笔巨大的收入。”黄仁勋说,而在一年之后,他看到2025年至2027年这部分收入将达到1万亿美元。
从客户变化和组成看,黄仁勋表示,2025年至今,成为英伟达新合作伙伴的包括Anthropic、MSL、Multiple OSS。英伟达来自超大规模云服务商的收入占比60%,还有40%来自无处不在的AI需求,包括区域云、企业云、工业AI、机器人、边缘AI、小服务器等。
对于英伟达部署的业务和思路,黄仁勋做了较为系统性的阐述。今年1月他强调英伟达在做协同设计后,此次再次强调,英伟达每token的成本是全世界最低的,一个重要原因是进行了协同设计。并表示,未来每家计算机公司、云厂商都会考虑token生产的效率。
谈到AI给科技行业带来的改变,黄仁勋表示,过去3年模型层面发生了三件重要的事情,2023年ChatGPT开启了生成式AI革命,推理式AI o1出现使AI能自己思考、分解问题,让token增加了10倍,2025年出现的首个代理式AI Claude Code则让token增加了100倍。随着AI能做一些创造性工作,AI推理迎来了拐点,过去两年工作所需计算需求增加了1万倍。
他指出,去年AI原生初创企业吸引了约1500亿美元的投资,这是史上最高的一个时期,投资事件的投资规模也从数百万美元、数千万美元增长到数亿美元、数十亿美元。原因是历史上第一次有这么多公司都需要大量的计算,需要由OpenAI、Anthropic等公司生产的很多token。
“就像PC时代诞生一批公司、互联网时代诞生一批公司,现在这一代人也将拥有一批特殊的公司。我们重新发明了计算,就会出现一批全新的、对世界未来产生重大影响的公司。”黄仁勋表示。
机器人方面,英伟达推出Isaac仿真框架、Cosmos和Isaac GROOT的新开源模型,供行业开发、训练和部署下一代智能机器人。其中Cosmos 3是首个统一合成世界生成、物理AI推理和动作模拟的世界基础模型。自动驾驶方面,英伟达还推出推理VLA模型(视觉动作语言)Alpamayo 1.5,用于增强自动驾驶汽车的推理能力。