五、“token工厂”来了:数据中心正在被重新定义
黄仁勋在GTC上抛出的另一个核心概念,是AI工厂(AI Factory)。他的原话非常直接:数据中心过去是存储文件的地方,现在它是生产token的工厂。
这是对整个云计算行业的一次重新命名。以前,一个数据中心的价值主要体现在:
- 存储了多少数据
- 支撑了多少业务系统
- 承载了多少互联网流量
但在AI时代,衡量一个数据中心价值的新指标,正在变成:
- 每秒可以生成多少token
- 在固定功率下吞吐量有多高
- 交互速度有多快
- 不同token层级能创造多少收入
黄仁勋甚至提出,token将成为新的“大宗商品”,并会像云服务一样形成分层定价体系:
- 免费层
- 中档层
- 高端层
- 高速层
- 超高速层
换句话说,未来云厂商、AI公司、企业平台,都会围绕“token生产效率”展开竞争。这背后的逻辑很清晰:谁能更低成本地生成高价值token,谁就能获得更强的商业化能力。
这也意味着,AI基础设施的商业模式,从卖算力,升级为卖“高质量推理产能”。
六、1万亿美元,不是估值,而是基础设施需求
黄仁勋在演讲中给出了一个极具震撼力的判断:去年GTC时,他认为到2026年,Blackwell和Rubin相关需求规模约为5,000亿美元;而一年之后,他现在看到的数字已经变成:到2027年,AI基础设施需求至少达到1万亿美元。而且,他还特别补了一句:“实际计算需求将远不止于此。”
这背后并不难理解。如果AI进入推理时代、智能体时代、机器人时代,那么消耗算力的将不只是几家大模型公司,而是整个平台经济、企业软件、云服务、工业系统、自动驾驶和边缘设备。
也就是说,AI基础设施不再只是科技公司的资本开支,而会逐渐成为:
- 企业数字化的标配
- 国家级主权算力的底座
- 新型工业体系的关键生产要素
这就是黄仁勋为什么敢把市场规模直接推向“万亿美元”的原因。
七、Blackwell、Rubin与Groq:英伟达开始重新发明“推理系统”
为了支撑推理时代,英伟达正在做的已经不是单纯升级GPU,而是重写整套系统架构。
这次GTC,黄仁勋重点讲了三件事:
1. Grace Blackwell+NVLink 72
这是一次非常激进的系统重构。英伟达把原来的互联方式从8路大幅扩展到72路,试图把整个计算系统真正做成“一台巨型计算机”。
2. NVFP4+TensorRT-LLM+Dynamo
英伟达推出新的低精度计算能力与推理优化软件栈,目标非常明确:在尽可能不损失精度的情况下,把推理性能和能效拉到极致。
3. Vera Rubin+Groq协同
Rubin面向智能体负载,Groq则擅长极低延迟的推理生成。通过Dynamo进行统一调度后,前填充和注意力计算交给Rubin,大规模token生成交给Groq,从而实现系统层面的协同优化。
黄仁勋给出的结果非常夸张:两年时间里,1吉瓦AI工厂的token生成速率,可从2,200万token/秒提升到7亿token/秒,提升350倍。
这并不是简单的“芯片升级”,而是英伟达最擅长的那套打法:极致协同设计(Extreme Co-design),芯片、系统、网络、编译器、推理软件、数据调度,一起做。
这也是为什么黄仁勋反复强调,英伟达是一家“垂直整合、横向开放”的公司。
文章内容仅供参考,不构成投资建议,投资者据此操作风险自负。转载请注明出处:天府财经网