3月16日,黄仁勋站在GTC 2026大会的舞台中央,用他一贯充满激情与远见的演讲风格,向世界宣告:计算的基本单位正在从“指令”变为“Token”,计算的组织形式正在从“数据中心”变为“AI工厂”,而计算的最高形态则从“运行软件”变为“驱动智能体”。这三个转变,环环相扣,共同构成了一个数万亿美元新市场的地基。
在演讲的开篇部分,黄仁勋通过一张精心准备的图表,揭示了英伟达乃至整个AI产业最根本的驱动逻辑——“装机量飞轮”。这个概念听起来抽象,其实非常直观。过去二十年,英伟达通过CUDA平台,在全球积累了数亿块兼容的GPU。这些硬件像一个个据点,吸引着开发者在其上编写程序、创造算法。当优秀的算法诞生,就会催生新的应用市场,进而吸引更多企业加入生态,最终又进一步扩大了硬件装机量。这个正向循环如同一个越转越快的轮子,让英伟达的生态系统拥有了强大的引力。
然而,推动这个飞轮在今日以前所未有速度旋转的燃料,正在悄然改变。黄仁勋指出,过去两年,AI领域发生了三件里程碑式的大事,深刻改变了计算需求的性质:
生成式AI的爆发(ChatGPT时刻):AI不再仅仅是感知和理解信息,而是能够创造全新的、独特的内容。这意味着计算机从“检索答案”转变为“生成答案”,计算模式从可预测的确定性计算,转向了概率性的生成计算。
推理AI的崛起(以OpenAI o1为代表):AI开始具备自我反思和规划能力。面对一个复杂问题,它能将其拆解为多个子步骤,逐一求解。这个过程需要AI在“思考”阶段生成大量的中间Token,消耗的计算量也随之激增。黄仁勋强调:“过去两年,推理所需的计算量增长了约10,000倍。”
智能体AI的诞生(Claude Code):这是最深刻的变革。AI从回答问题,进化到能主动“做事”——读取文件、编写代码、编译测试、迭代优化。它变成了一个能使用工具、规划并执行任务的“员工”。
这三重进化共同指向一个结论:大模型产业的核心正在从“训练”转向“推理”。训练好比是制造一辆智能汽车,是一次性的巨额投资;而推理则是让这辆车日夜不停地行驶在道路上,完成各类运输任务,是持续、大规模、高频次的运营。黄仁勋用数据佐证了这个判断:他引用第三方评测机构Semi Analysis的报告指出,英伟达在“每瓦特Token生成数”和“每Token成本”两个关键指标上遥遥领先。与上一代Hopper架构可能获得的1.5倍摩尔定律性能提升相比,新一代Grace Blackwell系统实现了高达35倍乃至50倍的推理性能飞跃。这不仅是技术的胜利,更是商业模式的胜利。
正因如此,算力需求的规模被重新定义。黄仁勋回顾,去年他曾预测2026年前全球AI基础设施投入规模约为5000亿美元。而一年之后,站在GTC 2026的讲台上,他将这个展望期的数字修正为:到2027年,至少是1万亿美元。他确信,实际需求将远不止于此。原因很简单:在AI时代,“如果能获得更多算力,就能生成更多Token,收入就会提升,AI就会变得更智能。”这形成了一个良性循环,驱使企业持续投入。
算力,已经超越了其作为技术工具的传统定义,正在成为未来社会如同电力、互联网一般的基础设施。它不再是可选的升级,而是生存与发展的必需品。无论是支撑万亿参数的模型运行,还是赋能数以亿计的智能体同时工作,都将创造出一个前所未有的庞大市场,其规模将达数万亿美元,触及金融、医疗、制造、娱乐等每一个行业。
如果说算力是新时代的“电力”,那么如何组织和驾驭这股洪流,则需要新的“电网”和“电器”。黄仁勋演讲中最具革命性的技术主张,莫过于对“操作系统”概念的重新定义。
1.OpenClaw“龙虾”成为智能体时代的新操作系统
在演讲中,黄仁勋隆重介绍了OpenClaw”(“龙虾”)项目。他称其为“人类历史上最受欢迎的开源项目,在短短几周内便超越了Linux三十年的成就”。这个听起来有些夸张的描述,背后是技术范式的根本性转移。
OpenClaw的本质,是一个“智能体系统”。黄仁勋用“操作系统”的术语来类比它:
管理资源:它调度和分配Token预算,连接文件系统、数据库和各种工具(API)。
执行调度:它规划智能体的任务队列,处理定时作业。
问题分解与调用:它能将一个复杂指令(如“分析本季度销售数据并生成报告”)分解为一系列子任务(访问数据库、清洗数据、生成图表、撰写分析、发送邮件),并可能调用其他专精的“子智能体”来完成。
多模态交互:它接受和输出文本、语音、视频、邮件等多种形式的信息。
简而言之,OpenClaw是智能体计算机的操作系统,就像Windows是个人计算机的操作系统一样。黄仁勋断言:“每一家企业都需要制定自己的OpenClaw战略,正如我们都需要Linux策略、HTML策略、Kubernetes策略一样。”
这场变革将彻底重塑企业IT的形态。过去,企业IT的模式是:数据输入 → 流经各种工具软件 → 产生结果供人决策。软件公司出售“工具”,系统集成商帮助企业安装和使用这些工具。而在OpenClaw开启的智能体时代,模式变为:任务输入 → 智能体调用工具和数据 → 自主完成工作并交付成果。软件公司的角色将从“工具提供商”转变为“智能体服务提供商”(AaaS, Agentic as a Service)。例如,一家财务软件公司不再只卖记账软件,而是提供一个能自动处理账目、生成报表甚至进行财务分析的“财务智能体”。
当然,让AI智能体在企业内部自由访问敏感数据、执行代码、对外通信,存在巨大安全风险。英伟达为此推出了企业级解决方案:NeMo Claw(基于OpenClaw的参考设计框架)和 Open Shield(集成于OpenClaw的安全层,提供策略引擎、网络护栏和隐私路由)。这预示着一场价值数万亿美元的企业IT“文艺复兴”:一个从提供“工具”转向提供“专业化AI员工服务”的巨大市场正在开启。2.物理AI实现从数字孪生到具身智能智能体革命不仅发生在比特构成的数字世界里,也正在原子构成的物理世界中展开。黄仁勋称之为“物理AI”——即具身化的智能体,也就是机器人。在GTC现场,共有110款不同形态的机器人亮相,涵盖了自动驾驶车辆、工业机械臂、人形机器人等。英伟达为此构建了完整的计算体系:训练计算机:在云端训练机器人的“大脑”(AI模型)。仿真计算机:利用Omniverse平台,在虚拟世界中进行极高保真的物理仿真,让机器人低成本、高效率地学习和试错。机载计算机:搭载于机器人本体上的边缘计算单元(如Jetson系列),实时运行模型,控制肢体动作。
其中,自动驾驶被黄仁勋称为已迎来“ChatGPT时刻”。他宣布了与比亚迪、现代、日产、吉利等车企的新合作,使其“RoboTaxi Ready”平台合作伙伴的年产量总和达到惊人的1800万辆。与出行巨头Uber的合作,则旨在推动自动驾驶车队的规模化部署。而在工业与通用人形机器人领域,英伟达展示了与迪士尼合作开发的“Olaf”雪人机器人。
这个可爱的角色并非依靠预设动画,而是通过在Omniverse中进行物理仿真学习行走,并凭借其内部的Jetson计算机实时运行Newton求解器,来适应真实的物理世界互动。黄仁勋畅想,未来的迪士尼乐园,将由无数这样在真实环境中自主行动的机器人角色构成。这象征着物理AI从实验室走向大规模商业落地的开端:自动驾驶解决移动问题,工业机器人重塑生产流程,通用人形机器人则有望进入家庭与商业服务领域。三者共同构成了物理AI的下一个重大机遇。
技术变革的浪潮,最终将拍打在经济与商业的海岸上,重塑财富创造与分配的基本规则。黄仁勋用“AI工厂”这个极具洞察力的概念,清晰刻画了这一转变。
1.数据中心的重新定义:从“仓库”到“工厂”
过去,数据中心的核心功能是“存储”和“处理”文件与数据。它像一个巨型仓库,数据在里面被归档、检索、运算,目的是为了支撑人类的信息处理需求。今天,在AI时代,数据中心的本质已经改变。它变成了“生产Token的工厂”。黄仁勋指出:“每一家云服务商、每一家AI公司,未来都将以‘Token工厂效率’作为核心经营指标。”在这里,输入是电力、数据和模型,输出是具有商业价值的Token序列——可能是高质量的答案、一段代码、一个设计方案、一幅图像,或者一个机器人的控制指令。
衡量这家“工厂”竞争力的核心指标,变成了黄仁勋定义的二维图。
纵轴:吞吐量。即在固定功耗下,每秒能生产多少Token。这决定了工厂的“产能”和成本效益。
横轴:交互速度。即生成单个Token的延迟。这决定了产品的“质量”和用户体验,能否支撑更复杂、更智能的交互。
2.Token:信息科技时代的“新货币”
这个转变将Token推向了经济舞台的中心。黄仁勋断言:“Token是新的大宗商品。”与石油、小麦等传统大宗商品类似,Token市场一旦成熟,将会自然分层定价:
免费层:高吞吐、低速度,适用于批量处理、内容总结等对实时性要求不高的场景。
中级层:约每百万Token 3美元,适用于标准的问答、写作助手。
高级层:约每百万Token 6美元,用于更复杂的推理和分析。
高速层:约每百万Token 45美元,支撑实时的、深度的交互。
超高速层:约每百万Token 150美元,为最顶尖的实时智能体服务(如高速代码生成、实时复杂决策)买单。
这种分层意味着,Token生产效率(尤其是高价值Token的生成效率)直接转化为企业的收入能力。黄仁勋以Grace Blackwell系统为例,其相比前代Hopper,在最高价值层能提升35倍吞吐量,这直接对应着巨大的潜在收入增长。
更进一步,Token正在成为一种新的“资产类别”。企业不仅是Token的消耗者(为其员工购买Token服务),也将成为Token的生产者(为其客户提供Token服务)。这催生了一种新型的商业模式。例如,一家医疗影像分析公司,原本销售软件许可,未来可能按其AI智能体分析出的诊断报告(以Token形式输出)来计费。一家软件公司,不再仅仅卖开发工具,而是可能出售由其AI程序员智能体生成的代码行数。黄仁勋甚至描绘了一个未来职场图景:每位工程师除了薪资,还会获得与其相当价值的“Token预算”,以此驱动AI助手,将个人产出放大十倍。“入职附带多少Token配额”已成为硅谷招聘的新话题。
3.打造终极Token工厂
要在这场新经济中获胜,仅靠芯片性能提升远远不够。黄仁勋反复强调“极致协同设计”的理念。他以收购Groq技术并整合为例进行阐释:Groq是一种专为低延迟推理优化的数据流处理器,但其片上内存有限。英伟达的Dynamo调度系统将推理管线解耦:让计算密集和需要大内存的部分在功能强大的Vera Rubin系统上完成,而将极致追求低延迟和高速生成的部分放在Groq上完成,两者通过网络紧密耦合。这种组合,在特定工作负载下实现了整体性能的数十倍提升。
这就是未来“AI工厂”的设计哲学:从芯片架构、系统互连(如NVLink)、软件栈(如TensorRT-LLM、Dynamo),到数据中心级的冷却、供电和网络,全栈、全系统、全方位地进行协同优化。英伟达为此推出了NVIDIA DSX 平台,一个供所有供应商在数字孪生环境中联合设计和运营吉瓦级AI工厂的虚拟协作空间,旨在将能源利用效率提升一倍。
黄仁勋长达两万五千余字的演讲,最终汇聚为四个核心结论:推理拐点已至、AI工厂时代开启、OpenClaw智能体革命、物理AI规模化落地。这四大趋势,如同四条巨大的轨道,正在交汇于同一个终点——一个以算力为基础设施、以Token为流通载体、以智能体为核心生产力的新世界。
对于开发者而言,这意味着需要学习如何与智能体协作,如何设计、训练和优化能够生成价值的AI模型。对于企业而言,这意味着需要重新思考IT战略,规划自己的“OpenClaw”路径,并评估如何建设或使用自己的“Token工厂”。对于投资者而言,这意味着需要识别那些能在这场从软件到智能体、从数据存储到Token生产、从CPU到专用加速系统的结构性变革中占据有利位置的公司。
回望CUDA二十周年与GeForce二十五周年的历程,英伟达押注的是一条漫长而艰难的道路。而今天,当生成式AI点燃的火焰照亮了整个科技产业,当推理算力的需求增长百万倍,当智能体开始接管软件工作,当物理机器人从仿真世界走向真实工厂与街道,历史证明,那个关于“装机量飞轮”的远见,正在转变为驱动整个时代前行的引擎。GTC 2026演讲的意义,不仅在于展示了英伟达的产品路线图,更在于它为企业、开发者和投资者提供了一张驶向未来的航行图。在黄仁勋描绘的新世界里,计算不再是目的,而是创造智能、生成价值、推动进步的强大手段。
声明:本文由入驻金色财经的作者撰写,观点仅代表作者本人,绝不代表金色财经赞同其观点或证实其描述。
提示:投资有风险,入市须谨慎。本资讯不作为投资理财建议。
深潮TechFlow
哔哔News
漫步金融街
数经科技
金色财经 善欧巴
