英伟达CEO黄仁勋GTC重磅演讲:万亿美元推理时代来了,AI工厂、智能体与机器人一起爆发

五、“token工厂”来了:数据中心正在被重新定义

黄仁勋在GTC上抛出的另一个核心概念,是AI工厂(AI Factory)。他的原话非常直接:数据中心过去是存储文件的地方,现在它是生产token的工厂。

这是对整个云计算行业的一次重新命名。以前,一个数据中心的价值主要体现在:

  • 存储了多少数据
  • 支撑了多少业务系统
  • 承载了多少互联网流量

但在AI时代,衡量一个数据中心价值的新指标,正在变成:

  • 每秒可以生成多少token
  • 在固定功率下吞吐量有多高
  • 交互速度有多快
  • 不同token层级能创造多少收入

黄仁勋甚至提出,token将成为新的“大宗商品”,并会像云服务一样形成分层定价体系:

  • 免费层
  • 中档层
  • 高端层
  • 高速层
  • 超高速层

换句话说,未来云厂商、AI公司、企业平台,都会围绕“token生产效率”展开竞争。这背后的逻辑很清晰:谁能更低成本地生成高价值token,谁就能获得更强的商业化能力。

这也意味着,AI基础设施的商业模式,从卖算力,升级为卖“高质量推理产能”。

六、1万亿美元,不是估值,而是基础设施需求

黄仁勋在演讲中给出了一个极具震撼力的判断:去年GTC时,他认为到2026年,Blackwell和Rubin相关需求规模约为5,000亿美元;而一年之后,他现在看到的数字已经变成:到2027年,AI基础设施需求至少达到1万亿美元。而且,他还特别补了一句:“实际计算需求将远不止于此。”

这背后并不难理解。如果AI进入推理时代、智能体时代、机器人时代,那么消耗算力的将不只是几家大模型公司,而是整个平台经济、企业软件、云服务、工业系统、自动驾驶和边缘设备。

也就是说,AI基础设施不再只是科技公司的资本开支,而会逐渐成为:

  • 企业数字化的标配
  • 国家级主权算力的底座
  • 新型工业体系的关键生产要素

这就是黄仁勋为什么敢把市场规模直接推向“万亿美元”的原因。

七、Blackwell、Rubin与Groq:英伟达开始重新发明“推理系统”

为了支撑推理时代,英伟达正在做的已经不是单纯升级GPU,而是重写整套系统架构。

这次GTC,黄仁勋重点讲了三件事:

1. Grace Blackwell+NVLink 72

这是一次非常激进的系统重构。英伟达把原来的互联方式从8路大幅扩展到72路,试图把整个计算系统真正做成“一台巨型计算机”。

2. NVFP4+TensorRT-LLM+Dynamo

英伟达推出新的低精度计算能力与推理优化软件栈,目标非常明确:在尽可能不损失精度的情况下,把推理性能和能效拉到极致。

3. Vera Rubin+Groq协同

Rubin面向智能体负载,Groq则擅长极低延迟的推理生成。通过Dynamo进行统一调度后,前填充和注意力计算交给Rubin,大规模token生成交给Groq,从而实现系统层面的协同优化。

黄仁勋给出的结果非常夸张:两年时间里,1吉瓦AI工厂的token生成速率,可从2,200万token/秒提升到7亿token/秒,提升350倍。

这并不是简单的“芯片升级”,而是英伟达最擅长的那套打法:极致协同设计(Extreme Co-design),芯片、系统、网络、编译器、推理软件、数据调度,一起做。

这也是为什么黄仁勋反复强调,英伟达是一家“垂直整合、横向开放”的公司。

文章内容仅供参考,不构成投资建议,投资者据此操作风险自负。转载请注明出处:天府财经网

(0)
双国民品牌战略“落子”:美的华为合作首款鸿蒙智选空调即将问世,重新定义智慧空气体验
上一篇 2026-03-11 14:42
全栈自研+量产落地!宇树科技招股书揭开人形机器人技术底牌
下一篇 2026-03-23 17:17

相关推荐

  • WEEX Labs:英伟达财报夜,AI 半导体“抢跑”,资金在押注什么?

    美股市场的钟摆,总是在“宏观压力”与“产业信仰”之间反复试探。 今晚,美东时间 5 月 20 日盘后,英伟达 (NVDA) 2027 财年 Q1 财报即将亮相。这场被市场视为“AI 超级周期风向标”的发布,将直接检验半导体板块的成色。 而在财报揭晓前,板块已率先“抢跑”。 半导体集体“抢跑”:资金在押注什么? 据 WEEX TradFi 实时数据,半导体板块今日盘前表现抢眼: 与此同时,宏观防御性资产并未缺席:XOM (埃克森美孚) 涨 2.3%,LMT (洛克希德·马丁) 涨 1.3%。加密金融方向,受 CLARITY Act 预期提振的 COIN (Coinbase) 涨 2.3%,CRCL (Circle) 小幅跟涨 0.4%。 高油价、地缘扰动与美债收益率上行固然构成压力,但 AI 链条的“刚需属性”显然更胜一筹。 WEEX Labs 认为,这轮半导体“抢跑”并非情绪炒作,而是资金对 AI 产业链从“训练侧”向“推理/存储/互联侧”扩散的精准押注。尤其值得关注的是,链上代币化的美股标的 (如 MRVLON/USDT、SNDKON/USDT) 凭借 24/7 交易与 T+0 机制,往往比传统市场更早反映机构调仓意图,已成为捕捉产业轮动的“先行指标”。 英伟达财报:不再是“强心剂”那么简单 英伟达作为 AI 时代的“卖铲人”,已连续多个季度交出超预期答卷。但今晚的财报,看点已从“是否超预期”转向“超预期的质量”。 分析师普遍预计 Q1 营收在 670-790 亿美元区间,EPS&nbs…

    2026-05-20
    1.4K00
  • AI浪潮下逆势爆发!深度解析台湾经济高增长的底层底气

    五大底层底气:读懂台湾经济的长期竞争力 外界常误以为台湾经济“只靠台积电一招鲜”,但全球能诞生高端芯片代工巨头的地区寥寥无几,台积电能扎根台湾、持续壮大,本质是台湾数十年精准布局、持续深耕的结果。抛开AI短期红利,台湾经济真正的核心底气,来自五大长期坚守的底层布局。 1. 低税赋能模式:藏富于民,激活社会内生动力 不同于欧美国家依赖“二次分配”的福利模式,台湾走出了一套独特的社会赋能体系。欧美多国依靠高税收、高福利调节社会公平,但在选举政治影响下,福利支出持续扩张、税负居高不下,OECD成员国平均税负比达34%,高福利导致民众劳动意愿下降、社会躺平风气蔓延,最终引发经济停滞、债务高企等问题。 而台湾不含社保的税负比仅为14.6%,在全球发达经济体中处于垫底水平。台湾摒弃了“高税收、高福利”的行政分配模式,不依靠庞大官僚体系调剂财富,而是通过强制企业涨薪倒逼产业升级。企业想要维持利润、持续发展,就必须摒弃廉价劳动力依赖,主动升级设备、加大研发投入。与此同时,民众收入稳步提升,带动消费升级与教育投入,形成“企业升级-民众增收-社会消费-产业迭代”的良性循环,真正实现藏富于民,激活社会内生发展动能。 2. 基建取舍有道:重产业实干,轻表面面子工程 在基建布局上,台湾始终坚持“务实优先、产业为本”的取舍原则,拒绝不计成本的扩张和华而不实的面子工程。岛内没有大规模地标建筑、巨型广场等形象工程,部分城区市容甚至略显老旧,但资金全部精准落地到产业刚需领域。 大量财政投入转化为产业底层基建:科学园区超高压变电所、工业专用水网、全岛光纤网络等硬核产业配套,为半导体、电子产业发展筑牢根基。诚然,民主程序导致台湾基建落地节奏偏慢,存在电力吃紧、设施老化等短板,但慢节奏也换来了全社会稳定的产权信心,避免了基建盲目扩张的资源浪费,让每一笔投入都服务于实体经济发展。 3. 扎实技职教育:搭建完善的产业…

    2026-05-19
    1.7K00
  • 币股科普:当全球最贵的7+3 家公司,成为加密世界的底层资产

    三、新变量值得高度关注:2026 年三大超级 IPO 七姐妹的格局并非一成不变。2026 年,三家史上最大规模的私人科技公司正在排队 IPO——它们一旦上市,不仅可能重新定义七姐妹,更可能对全球资本市场的流动性结构产生系统性的颠覆。 WEEX Labs 先前在《2026美股三大IPO狂欢:OpenAI、SpaceX、Anthropic如何重塑RWA新叙事?》一文中就对此做过介绍: 1 SpaceX —— 太空经济 发射任务与 Starlink (星链卫星互联网) 贡献绝大部分收入,两项业务合计 2026 年收入预计超过 200 亿美元。SpaceX 已秘密提交上市文件,计划于 2026 年 6 月前后进行 IPO,目标估值已从早期的 1.75 万亿美元上调至 2 万亿美元以上。 2 OpenAI —— AI 应用层王者,ChatGPT 母公司 作为生成式 AI 的鼻祖,OpenAI 的年化营收已飙升至 250 亿美元。OpenAI 计划最早于 2026 年第四季度 IPO,目标估值约 1 万亿美元。 3 Anthropic——AI 安全公司,Claude 模型开发商 作为 OpenAI 的头号劲敌,Anthropic 主打“安全、可靠的 AI”。它吸引了亚马逊和谷歌的大量投资,估值锚定 3500 亿美元,是企业级 AI 市场的宠儿。Anthropic 正考虑最快于今年 1…

    2026-05-01
    16.9K00
  • NVIDIA何以成为全球AI训练标配?“黄氏定律”如何取代摩尔定律?一文了解芯片新王英伟达

    其实往大点说,整个显卡市场是个三足鼎立的状态,三大巨头:英特尔市场占有率71%、英伟达17%、AMD 12%。奇怪了,怎么又闹出来个英特尔,而且市场占有率还这么高? 实际上,此显卡非彼显卡。因为这个显卡,它分为独立显卡和集成显卡,你要把这俩都放一起比,那英特尔确实是老大,但它基本上卖的全都是集成显卡,集成显卡是和CPU封装在一起的,共享内存,英特尔就利用它的CPU的垄断地位霸占着集成显卡的份额。不过集成显卡它比较弱,和英伟达这个独立显卡比起来,虽然都叫显卡,但不是一个市场。单看独立显卡,英伟达占了80%以上。 那怎么英伟达又跟AI扯上关系了?为什么这些AI公司都得买英伟达的显卡呢?这就说到显卡的特性了。 电脑里的CPU(就中央处理器),它本身的设计目的就是它什么都能干,它是顺序计算,可以进行非常复杂的逻辑推理,可是这个图形处理它其实不怎么在意顺序,更在意的是计算量,你比如说一个4k的视频,那小一千万个像素点,假设每秒30帧,那每一个像素点、每一帧都得根据它的阴影、动作计算出来一个对应的颜色,这就需要不停地进行非常快速而且大量的简单计算。 GPU(图形处理器)就专门设计出来针对这类计算的一个单元,它底层的芯片设计就是为了优化这类并行计算。所以你看CPU一般撑死了就是64核、128核,而GPU它可以有成千上万个核,一起在那计算。 就是因为GPU这个特性,黄仁勋就开始琢磨了,你说我怎么才能挖掘出它更大的潜力呢?这肯定不光是3D图像处理、渲染这么简单,我能不能进行更多通用目的的计算(General Purpose Computing),做一个通用目的的图形处理器GPGPU。 但当时你要想用GPU做通用计算其实并不是那么简单,因为毕竟本身设计就不是来干这个,所以编程非常麻烦,一般人干不了这个活。黄仁勋就想了,所以要让显卡发挥更大的潜力就得让它可编程。 一次偶然的机会,他就看见斯坦福一…

    2023-07-19
    18.4K00
  • 巨头All in元宇宙背后:机遇夹杂着无奈,跟风裹挟着绑架

    Facebook改名Meta,元宇宙。明星在元宇宙开演唱会,林俊杰在元宇宙买地,百度。就在这家公司的官方招股说明书上,一共出现了16次Metaverse。 而在开头总结的部分,他们就说现在要做的就是打造一个早期的元宇宙。 你看这个元宇宙,听着是不是就很酷?我们简单来说一下,这个游戏是怎么回事。我也没玩过,但是我看过。它其实就是个交易系统,也有自己的货币,叫做Robux。你可以在上面开发游戏,自己建城堡,然后就可以卖东西赚钱了,是不是挺有意思的? 别看这个游戏看着不是那么的精致,但是据2021年10月的最新数据显示,这个游戏每天的日活有4300万人,那可是日活。据估算2021年,平台上所有的交易额(用户之间买卖产生的交易额)就达到了5亿美金。 所以你看,它其实就是一个网络游戏,但它跟普通网络游戏不一样。而跟元宇宙这个事比较像的一点在于它不是说你去玩一个人建好的游戏,就在那过关打怪兽就OK了,而且你可以不光自己玩游戏,你还可以建游戏,里边还有自己的货币和交易系统,这就有点像元宇宙,因为它自己就形成了一个简单的虚拟经济体。 但是Roblox扯元宇宙这个事其实也挺牵强,你想元宇宙它不是虚拟世界吗,它就需要VR的技术,而Roblox它成立于2006年,2017年才开始引入一些VR的体验,直到现在,大部分的用户还只是对着那个电脑屏幕玩。所以结论就是,虽然Roblox也扯上了元宇宙,但这就是理想和现实之间的差距。 有小伙伴就说了,我懂了,这不就是个概念炒作吗?没错,它就是个概念炒作。为什么要炒作?原因就是我们刚才说的它要上市,它上市不是传统的股票,那你就需要宣传,就需要造势,那你就需要一个新的概念,让他们头脑发热。你要跟人家说,我是一个网上的在线乐高游戏,大家没什么兴趣;要跟人说,我要打造一个初期的元宇宙,这个概念好厉害,买买买! 刚才我们讲的Roblox,是说为什么2021年三四月份出…

    2023-04-23
    12.0K00

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

− eight = one
Powered by MathCaptcha

目录