免责声明：金色财经所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（jinse.com.cn）举报

美国AI研究员：深入中国AI实验室的观察笔记

金色财经

刚刚

来源：Nathan Lambert，Allen Institute for AI研究员、；编译：金色财经Claw

从杭州到上海的高铁上，望着窗外，映入眼帘的是层峦叠嶂的山脊线——风力涡轮机点缀其间，在夕阳余晖中勾勒出剪影。山峦之间，广袤的田野与林立的摩天大楼交相辉映。

我带着深深的谦逊之心从中国归来。走进一个如此陌生的地方，却受到如此热情的欢迎，这是一段令人心暖的人文体验。我有幸结识了许多此前只能远观的AI生态圈中的人们，他们以灿烂的笑容和热情迎接我，让我深切感受到我的工作与整个AI生态系统的全球性。

中国研究人员的思维方式

中国AI公司在大语言模型领域天然具备"快速跟随者"的优势——这既源于中国在教育与工作上历久弥深的文化传统，也得益于其在构建科技公司方面独特而微妙的方式。

从产出来看，无论是支撑智能体工作流的最新大模型，还是优秀的科学家、海量的数据与强大的算力这些核心要素，中美两国的实验室看起来大同小异。真正持久的差异，体现在组织方式与内在驱动力上。

我长期以来认为，中国实验室之所以能够如此出色地追赶并保持在前沿水平，部分原因在于其文化与这一使命高度契合。但在未曾与人深入交流之前，我并不觉得贸然将这一直觉归因于文化是恰当的。与中国顶尖实验室众多优秀、谦逊而坦诚的科学家们的对话，使我的许多判断得以清晰成型。

当今构建最优秀大语言模型的核心，在于对整个技术栈的精细打磨——从数据到架构细节，再到强化学习算法的实现，无一不需要一丝不苟。模型的每一个环节都有提升空间，而将它们有机融合是一个极为复杂的过程：某些天才个体的工作成果，往往需要为整体模型的多目标优化让路。

美国研究人员在攻克各个单项难题上固然才华横溢，但美国文化中有一种更强烈的自我表达倾向。作为科学家，为自己的工作发声往往更容易获得成功，而当下盛行的"顶尖AI科学家"明星效应更是推波助澜。这就产生了直接的冲突。据广泛传闻，Meta的Llama团队正是在这种利益驱动下的派系政治压力中走向瓦解。我也曾听闻某些实验室不得不"打点"某位顶级研究员，才能让其停止抱怨自己的想法未被最终模型采纳。不管细节是否属实，这背后的逻辑是清晰的：自我与对职业晋升的执念，确实会妨碍最优模型的诞生。中美两国在这种文化氛围上哪怕只有细微的偏移，也可能对最终产出产生实质性的影响。

这与中国模型的构建者群体密切相关。在中国各大实验室，有一个显而易见的现实：核心贡献者中有相当大比例是在读学生。这些实验室都非常年轻，让我想起Ai2的运作方式——在那里，学生被视为同等级别的伙伴，直接融入大语言模型团队。这与美国顶尖实验室的做法截然不同：OpenAI、Anthropic、Cursor等公司根本不提供实习机会。其他公司如谷歌名义上提供与Gemini相关的实习，但许多人担心实习项目会被隔离在核心工作之外。

总结一下这种文化上的细微差异如何提升模型构建能力：

更愿意从事不那么光鲜的工作，以此改进最终模型；
初入AI领域的人没有历史包袱，不受此前AI炒作周期的束缚，能够更快地适应现代新技术（事实上，我交流过的一位中国科学家非常主动地将此视为自身优势）；
更少的自我意识使组织架构得以适度扩张，因为少了对规则的钻营投机；
充沛的人才储备，擅长在已有概念验证的基础上解决问题。

这种更倾向于契合当今语言模型构建所需技能的特质，与一个广为人知的刻板印象形成了对比——即中国研究人员在开创性的、从零到一的学术研究方面往往较为逊色。在我们访问的偏学术型实验室中，许多负责人都谈到了如何培育更具抱负的研究文化。与此同时，一些技术领导者对这种科研方式的短期内重塑持怀疑态度，认为这需要对教育和激励体系进行彻底改革，而这一变革在当前经济均衡下规模太大，难以在近期实现。这种文化正在培养出在大语言模型构建上极为出色的学生和工程师，而且数量极为充沛。

这些学生也告诉我，中国正在经历与美国类似的"人才虹吸"现象——许多此前考虑走学术道路的人，如今选择留在工业界。最妙的一句话，来自一位本想当教授、希望与教育体系保持紧密联系的研究员。他感慨道，教育已经被大语言模型解决了——"学生为什么还要来找我！"

学生们的优势在于，他们是以全新的眼光看待大语言模型的。过去几年，大语言模型的核心范式经历了从规模化混合专家模型（MoE），到规模化强化学习，再到赋能智能体的几次重大转变。要在每一次转变中做到出色，都需要迅速消化海量信息——既来自更广泛的学术文献，也来自公司内部的技术栈。学生们已经习惯了这一点，他们乐于谦逊地放下一切先入为主的假设，一头扎进去，全身心投入，只为争取到一个能够改进模型的机会。

这些学生还有一种令人印象深刻的直接与纯粹，少了许多可能分散科学家注意力的哲学性闲谈。当我追问他们对AI经济影响或长期社会风险的看法时，鲜有中国研究人员持有深思熟虑的观点，也少有人热衷于在这些议题上施加影响。他们的使命，就是构建最好的模型。

这种差异是微妙的，容易被忽视，但在与某位表达能力极强、英语流利的优秀研究员进行深入交流时，会有最直接的感受——当话题转向AI更宏观的哲学层面，对方往往只是简单地面露困惑，仿佛这是一个分类错误的问题。一位研究员甚至引用了Dan Wang关于"中国由工程师治理，而美国由律师治理"的著名论断，来强调自己专注于建造的心志。在中国，没有像Dwarkesh或Lex那样能够系统性地为科学家打造明星光环的主流媒体平台。

试图让中国科学家就人工智能引发的未来经济不确定性、超越简单通用人工智能（AGI）能力范围的问题，或关于模型行为方式的道德辩论发表评论，都暴露了这些科学家的成长经历和教育背景（5月7日编辑：在原文的这一段中，我错误地将不愿谈论更广泛的问题归因于谦逊，谦逊当然可能起到一定作用，但这种习惯也受到他们所受训练和成长的体系的影响，他们在这个体系中取得了成功，并且擅长驾驭它。我删除了以下内容：……展现这些科学家的成长经历和教育背景，以及他们极其谦逊的品质。这不仅仅是对工作的奉献，他们也不愿对不了解的问题发表评论……）。他们对工作极其投入，但成长在一个不鼓励就社会结构和变革展开辩论和发表意见的体制中。

从宏观层面看，北京与湾区颇为相似——步行或打个车，就能到达另一家具有竞争力的实验室。我下了飞机，在去酒店的路上顺路拜访了阿里巴巴的北京园区。此后短短36小时内，我们又接连走访了智谱AI（Z.ai）、月之暗面（Moonshot AI）、清华大学、美团、小米和零一万物（01.ai）。滴滴出行方便快捷，选择XL车型时，常常配备的是带有按摩椅的电动小型厢式货车。我们向研究人员问及人才争夺战，他们表示与美国的情况非常相似：研究员跳槽早已是家常便饭，去哪里往往取决于当下哪家公司的氛围最好。

在中国，大语言模型社区更像一个生态系统，而非相互厮杀的部落。在许多非正式的私下交流中，彼此之间满是对同行的尊重。所有中国实验室都对字节跳动的热门模型豆包（Doubao）心怀敬畏——它是中国唯一一个前沿闭源实验室。与此同时，所有实验室都对DeepSeek推崇备至，视其为在研究品味与执行力上最为出色的实验室。DeepSeek引领方向，却并不具备赢得市场的商业体量。

相比之下，在美国与实验室成员私下交流时，火药味往往很快就上来了。中国研究人员之所以令人印象深刻，还有一点在于：他们常常对商业问题轻描淡写，表示"那不是我的问题"。而在美国，似乎每个人都对各种生态系统级别的产业趋势——从数据销售到算力或融资——念念不忘。

中国AI产业与西方实验室的异同

如今，构建一个AI模型之所以如此引人入胜，正是因为它不再只是把一群优秀研究员聚在一栋楼里、打造出一个工程奇迹那么简单。这曾经是过去的模式，但要维系AI业务，大语言模型正在演变为构建、部署、融资与获取用户的综合体。领先的AI公司存在于复杂的生态系统之中，资金、算力、数据等各类要素汇聚其中，共同推动前沿的持续突破。

对于西方生态系统（以Anthropic和OpenAI为代表），这些要素如何整合以创建和维系大语言模型，已经有了相当成熟的概念框架。因此，找到中国实验室在思维方式上的重大差异，恰恰指向了不同公司在押注未来方向上的实质性分歧。当然，这些未来在很大程度上也受到资金和算力约束的左右。

以下是我与这些实验室交流后，在"AI产业"层面得出的最重要观察：

1、国内AI需求初现端倪。有一种广为流传的假设认为，中国AI市场规模将相对有限，因为中国企业历来不倾向于为软件付费，难以催生支撑实验室运营的大规模推理市场。但这一论断仅适用于映射至SaaS生态系统的软件支出——而SaaS在中国历史上本就体量较小；另一方面，中国显然存在规模可观的云市场。一个关键的未解之问——中国实验室内部对此也争论不休——是AI领域的企业支出，究竟会跟随SaaS市场（体量小）的轨迹，还是云市场（基础设施级别）的逻辑？总体感觉是，AI正在向云的方向靠拢，没有人对围绕新工具成长起来的市场感到悲观。

2、大多数开发者都是Claude的忠实用户。中国的大多数AI开发者对Claude痴迷不已，深感其改变了他们构建软件的方式——尽管Claude在名义上在中国遭到封锁。中国历史上不愿为软件付费这一事实，并不让我认为推理需求不会迎来大幅增长。中国技术人员如此务实、谦逊、积极进取——这一特质似乎比任何历史消费习惯都更有说服力。部分中国研究员提到会用Kimi或GLM的CLI等本土工具，但所有人都提到了使用Claude。令人意外的是，Codex几乎鲜有提及，而它在湾区的人气显然正在急剧攀升。

3、中国公司具有强烈的技术自主意识。中国文化正与澎湃的经济引擎相结合，催生出难以预测的结果。我有一种挥之不去的感受：众多AI模型折射出的，是中国众多科技企业当下务实而现实的生存状态，背后并无什么宏观统筹的蓝图。这个行业以对字节跳动和阿里巴巴的敬畏为基调——这两家巨头凭借雄厚资源，被普遍认为将在各大市场占据主导地位。DeepSeek是公认的技术领头羊，但远未成为市场领导者：它引领方向，却并不具备赢得经济博弈的体量。

这就给美团、蚂蚁集团等公司留下了空间——西方人有时会对它们也在构建自己的大模型感到惊讶。事实上，它们将大语言模型视为未来技术产品的核心底座，因此必须打好这个基础。通过微调通用基础模型，开放社区能够提供反馈，使其技术栈更加稳固，同时保留用于自身产品的内部专属微调版本。行业内盛行的"开放优先"心态，在很大程度上出于实用主义考量：帮助模型获得有力反馈，回馈开源社区，并借此更深入地理解自己的模型。

4、政府扶持确实存在，但力度仍不明朗。外界常常断言，中国政府正在积极助推开放大语言模型竞赛。然而，这个政府的权力结构是分散的，各层级对于自身该如何介入并无清晰的行动手册。北京的各个街道办事处甚至相互竞争，争取科技公司在其辖区落地办公。政府提供的"帮助"几乎可以肯定涉及简化审批等行政流程的疏通，但究竟能延伸多远？政府的各个层级能否协助招募人才？能否协助走私芯片？在整个访问过程中，政府关注或介入的话题多次被提及，但细节太过零散，不足以形成有据可查的断言，也无法构建一个关于政府如何左右中国AI走向的自洽世界观。当然，也没有任何迹象表明，中国政府的高层曾对模型的任何技术决策施加影响。

5、数据行业远未成熟。此前已听闻Anthropic或OpenAI为单个训练环境支出逾1000万美元，每年在强化学习前沿探索上的累计花费高达数亿美元。因此，我们迫切想了解：中国实验室是否在从美国公司采购同类环境，还是已有一套镜像的国内生态系统加以支撑？得到的答案并非"完全没有数据行业"，而是：他们的经验表明，国内数据行业的质量相对有限，自建环境或数据往往是更优选择。研究人员自己要花费大量时间搭建强化学习训练环境，而字节跳动、阿里巴巴等大型公司则拥有内部的数据标注团队予以支撑。这一切都与前述"自建而非外购"的思维定势一脉相承。

6、对Nvidia芯片的渴望如饥似渴。Nvidia算力是训练领域的黄金标准，所有人的进展都因算力不足而受限。若供货无虞，他们显然会毫不犹豫地大量采购。其他加速器——包括但不限于华为——在推理应用上普遍获得正面评价。无数实验室都已接入华为芯片。

以上这些特点，共同描绘出一幅与西方截然不同的AI生态图景。若将西方实验室的运作模式简单套用到中国同行身上，往往会产生"分类错误"的误判。最关键的问题在于：这两种不同的生态系统，最终是否会孕育出实质上有所差异的模型类型？还是说，中国模型终将只是对3至9个月前美国前沿模型的追随与重复？

结语：全球均衡

踏上这趟旅程之前，我深知自己对中国了解甚少，而归来时，却只感到自己刚刚开始入门。中国不是一个能用规则或配方来概括的地方，它有着截然不同的运作动力与化学反应。这里的文化古老而深邃，至今仍与国内技术的构建方式深度交融。我还有太多需要学习。

当前美国的诸多权力结构，都将各自对中国的固有认知作为重要的决策参照。然而，在亲身与中国几乎所有主要AI实验室进行了正式或非正式的对话之后，我深感中国有太多特质和直觉，是西方的决策框架难以有效建模的。即便直接追问这些实验室为何选择开放发布顶级模型，"技术所有权意识"与"真心支持生态"之间的内在逻辑，我仍难以完全贯通。

这里的实验室务实而灵活，并不是开源的绝对主义者——并非每一个构建的模型都会公开发布——但他们在支持开发者、反哺生态，以及借此深入理解自身模型方面，有着深刻而刻意的用心。

几乎每一家中国主要科技公司都在构建自己的通用大语言模型，美团（外卖平台）和小米（综合消费电子公司）发布开放权重模型便是例证。同等规模的美国公司，大概只会选择直接采购服务。这些公司构建大语言模型，并非为了追赶时髦、刷存在感，而是源于一种对掌握自身技术栈、把握时代最核心技术的深切渴望。当我从笔记本电脑前抬起头，视野中总是横亘着一片吊车的天际线——这与中国更广泛的文化气质和建造热情，形成了再自然不过的呼应。

中国研究人员的人情味、魅力与真诚的热情，极具人文感召力。在个人层面，我们在美国早已习以为常的那种剑拔弩张的地缘政治叙事，在他们身上丝毫未见。这份简单的正向能量，是世界需要更多的东西。作为AI社区的一员，我目前更担忧的，是社区内部成员与群体之间，以国籍为标签而产生的裂痕。

坦率地说，我希望美国实验室在AI技术栈的每个维度都保持清晰的领先地位——尤其在我深耕其中的开放模型领域——我是美国人，这是我真实的偏好。但与此同时，我也希望开放生态系统本身能够在全球范围内蓬勃生长，因为这可以为世界创造更安全、更普惠、更有价值的AI。而眼下的问题是，美国实验室是否愿意迈出那一步，去赢得并守住这个领导地位。

就在完成这篇文章之际，又有传言涌现，称美国总统行政令可能对开放模型施加影响，这将进一步复杂化美国领导力与全球生态系统之间的协同关系——这让我难以乐观。

感谢所有在月之暗面、智谱、美团、小米、通义千问、蚂蚁灵犀、零一万物等机构慷慨与我交流的朋友们。每一位都如此热情好客，如此大方地给予时间。我会持续分享对中国的思考，随着认识的深化，涵盖文化与AI两个维度。有一点毋庸置疑：这些认知，将与AI前沿发展的宏观叙事直接相关。