
2026年6月,硅谷。Anthropic的年化营收在过去12个月里翻了五倍多,达到470亿美元。四大科技巨头今年的AI资本开支指引合计超过7000亿美元,接近全球电信行业总投入的两倍。
当整个行业用“投资不足的风险比过度投资更大”自我说服时,Benedict Evans在a16z的播客室里谈起了2008年的移动数据危机。
那是iPhone首发后的混乱年月。AT&T推出无限流量套餐,用户疯狂看YouTube,网络瞬间瘫痪,运营商花数千亿美元扩容。最终,所有酷炫的应用都是别人做的,运营商只赚到了“管道费”。
Evans每年发布一份名为《AI Eats the World》的演讲,被硅谷视为观察技术周期的重要坐标。和大多数乐观主义者不同,他习惯从历史里找坏消息。在他看来,今天20美元/月的ChatGPT订阅与背后上万美元Token成本之间的裂缝,和当年5000亿美元天价数据账单出自同一种幻觉。定价与成本严重脱节,而所有人都假装没看见。
“所有赌注都还是开放的。”他坦承自己无法预测终局。但当模型效率每年提升100到200倍,而全球有近万亿美元资本涌入这个赛道时,他认为至少有一件事是确定的:今天这种“按ROI定价”的奢侈不会持续太久。
以下是Evans对AI经济学核心矛盾的六个判断:
1. 基础模型不是产品,价值终将向上游转移。模型公司很可能沦为卖水人,重蹈芯片商、ISP和移动运营商的覆辙。它们建造了惊人的基础设施,却没能捕获最多的利润。
2. 编程是目前唯一真正找到PMF的领域。Agentic Coding已从“有点用”跃迁为“改变一切”,但除此之外,大多数场景仍停留在“每周打开一次ChatGPT随便试试”的边缘。
3. 定价体系正在崩溃。当模型效率每年提升100-200倍,而CapEx以万亿规模涌入时,今天按ROI定价的奢侈不会持续。Token终将像移动数据一样,走向商品化价格战。
4. AI不会终结SaaS,但会重新定义软件的边界。概率性的LLM该放在技术栈的顶端还是底部?企业软件将迎来新一轮“Excel vs. 专用软件”的混沌博弈,更多的软件,更多的竞争,更不确定的利润率。
5. 历史只能解释,不能预测。移动互联网、云计算、PC时代的类比都有用,但没有一个能告诉你OpenAI会不会成为下一个Windows,还是下一个Netscape。
6. 真正的问题正在离开技术圈。AI对律所、投行、咨询公司和好莱坞意味着什么?这些答案不在旧金山,而在那些知道“初级员工到底在做什么”的行业内部人手里。
Erik Torenberg:Benedict,欢迎回到a16z播客。上次你来的时候,我们讨论了你那版演讲的第一版《AI Eats the World》。到现在你已经写完快一年半了。你总是从"哪些是大问题"开始演讲。但这次我想先问问:自你最初发表那次演讲以来,我们学到了什么?哪些预测成真了?我们来回顾一下。
Benedict Evans:先来谈谈过去一年发生了什么吧。我认为我们更清晰地看到了产品策略的分化,也看到了竞争张力——这种竞争已经不只是"把模型做得更大、更快、投入更多算力"那么简单了。
OpenAI的策略经历了好几次转向——从"昨天一次性押注所有方向",到"也许我们应该加倍押注编程领域"。显然,Agentic Coding已经真正开始奏效了。因此科技界的所有焦点都高度集中在这个领域,它已经具备了绝对的产品市场契合度,客户旺盛的需求几乎让你应接不暇。当然,这也带来了供应紧缺的问题,围绕容量、价格、供需失衡以及资本支出定价的矛盾,正是我们当下所看到的局面。这就是我们目前所处的节点——曾经我们觉得这玩意儿有点意思、挺令人兴奋,但又不完全确定能用它来做什么。而现在它确实能用于编程,至于能不能用于其他领域,答案几乎肯定是能的,但编程是目前真正发挥作用的地方。
现在焦点变得狭窄了很多。除此之外,数据还在不断上升:模型越来越大,CapEx持续增长,使用量也在增加,人们用得越来越多。但两三年前你提出的那些根本性问题,大部分至今仍没有答案。比如我们不知道模型领域会不会出现一个绝对的赢家,不知道他们能否在价值链上层获取价值,不知道模型的能力边界在哪里,也不知道以目前的技术,消费者什么时候会从每周使用变成每天使用。所以,所有这些问题依然悬而未决。
Erik Torenberg:说到编程,我们当初有没有可能预见到它会成为第一个真正爆发的应用场景?
Benedict Evans:如果你从确定性的角度看,可以这样推理:谁最喜欢摆弄这些东西?软件开发者。而软件开发者最想尝试用这些东西来做什么?当然是软件开发本身。所以从这个非常朴素的角度来看,软件开发的优先级最高。我经常把这个时刻类比成1997、1998年的互联网,或者70年代末80年代初的个人电脑时代——那时候一切都非常令人兴奋,但还不太清楚这东西到底是用来干什么的,因为它还没有真正成熟。早期人们用个人电脑做的最主要的事情就是制造更多的计算机,而如今人们用LLM(以及更大型的LLM)做的第一件事,也是制造更多的算力。所以这并不令人意外。
但今年年初发生了一个明显的转变:Agentic Coding从"还算有用"变成了"真正改变一切"。我不确定是否有人能准确预测到它会在什么时候发生,也不知道它就是第一个跑出来的应用。有些人事后会说自己早就料到了,但我不认为任何人能够确定性地预测到这一切会在什么时间点发生,并且就是以编程的形式率先突破。
Erik Torenberg:那在组织层面,我们学到了什么?对初级工程师、高级工程师,以及对岗位格局、团队组织形式意味着什么?
Benedict Evans:我觉得目前还什么都谈不上。六个月前这东西根本还没法用。现在所有人都在手忙脚乱地试图搞明白它到底意味着什么。你要是太沉溺于噪音和细节,抓住某人在某场活动上说的一句话就以为天要塌了,那就会陷入混乱。这一切至少要两三年才能稳定下来,且不说别的,光定价问题就存在巨大的供需矛盾,从而引发各种意外。所以我们根本不知道未来的团队会是什么样。
我认为人们开始提出一些新的问题,最明显的一个就是:你还招初级员工吗?如果招,他们做什么?你过去为什么要招初级员工?你招他们来到底是做他们本身能做的事,还是做别的事?如果你把过去由人来做的一整类工作都自动化了,那会发生什么?这个疑问在软件开发领域变得更真实了,因为你确实在把大量过去由人做的事自动化。所以这些疑问已经从理论层面变成了现实。但我认为没人能说自己知道未来三到五年的市场结构会是什么样,也不知道软件工程师的职业路径会变成什么样——你要是觉得自己能知道,那才是疯了。
Erik Torenberg:聊聊OpenAI吧。最让你感到意外的是什么?你如何理解他们的战略演变以及他们面临的未来问题?
Benedict Evans:这从来都是一个充满了戏剧冲突的地方。显然,他们的CEO因医疗原因休假,这让局面出现了一些变化。
去年下半年到第四季度,外界提出的问题是:模型本身还不错,但除此之外呢?你们怎么让人们用这些东西去做别的事情?几乎就像是在说"去问ChatGPT要15个如何基于基础设施构建价值的点子,然后全部照做",OpenAI差不多就是这么干的。而Anthropic资金实力相对较弱,他们说:我们专注于编码。然后他们就真的把编码做出来了。至于是有意为之还是偶然撞上的,留给别人去评说。但显然这招奏效了。
但问题依然存在:目前真正发挥作用的是软件开发,以及一些其他领域的部分场景。还有很多人只是兴致勃勃地在边缘试水,有的场景用一用。硅谷内部的分化也相当明显——一边是那些买了成堆Mac Studio、全天候跑开源模型的人,另一边是另外那百分之四五十的人,他们认为这东西确实有点用,但上周才用过一次。问题是,你怎么弥合这个鸿沟?我不认为这个问题有简单答案。软件开发确实跃过了那条鸿沟,但很多其他领域的人还在挠头,用起来也就是浅尝辄止。
另外还有很多企业正在用AI自动化一些特定的后台流程——这种情况下,你不是让用户自己去摸索这个新工具能做什么,而是直接告诉他们:这里有一个我们可以解决的问题。我去美国和科技行业之外的公司交流,也跟咨询顾问和投资者聊天,他们都在逐个审视这些点状解决方案。
比如我前两天跟一家大宗商品公司交流,他们想用LLM来改善现金流预测,因为他们跟很多小生产商打交道,不太确定什么时候能收到付款,而这是一个利润率很低的生意,所以现金流预测对他们来说是大问题。这跟去ChatGPT或Claude上随便说"帮我写点东西"完全是两回事。
Erik Torenberg:相比早期采用者每周或每天使用的情况,你怎么看?
Benedict Evans:我认为可以从几个不同的维度来回答。首先,我们永远是站在前人的肩膀上进步的,而且进步在不断加速。移动互联网不需要等互联网出现之后才诞生,它只需要等蜂窝数据网络到位。互联网不需要等个人电脑普及,个人电脑也不需要等消费电子产品和半导体先成熟。所以采纳速度一直在加快。当年你老板Marc Andreessen做Netscape的时候,全球个人电脑数量才几千万台。你不可能有9亿周活跃用户——因为根本没有9亿台电脑。所以加速度一直存在。
第二个要点是:这些变革的早期阶段,谁都看不清它会怎么运作,而且实际上什么都不能用。我年纪大到还能记得这些事情。我不知道你多大,但三十多岁的人可能已经不记得那个年代了——你正工作到一半,屏幕上的一切突然卡死,你得趴到桌子底下拔掉电源,然后祈祷过去一小时做的东西至少还能找回一部分。这种事现在再也不会发生了。
回到80年代,你买一块声卡就要花300美元,而电脑还未必能正常发声。那300美元花出去,还得搭上一个周末才能让它工作起来。我记得那些折腾的日子。互联网也是一样。你得先拿到一张装有TCP/IP协议的软盘,速度慢得要命,而且你想做的事根本还没有现成的工具。移动端也是一样。我们现在就处在那个阶段。当然,关键问题是:这里面哪些东西最终能成?现在也一样:浏览器能不能成?这东西到底能不能站稳?这一切怎么拼到一起?在那些极其令人兴奋的东西和愿意投入精力让它运转起来的一小群人之间,存在一条鸿沟,而我们要做的是把它变成一个一键就能搞定的事情。
Benedict Evans:第三点在于:单位的经济性变得更加切实可见了。我观察到,目前我们提到的定价紧缩与2009到2010年移动数据领域发生的情况非常相似。一方面,人们突然收到金额高达5000甚至10000美元的数据账单;另一方面,如果你用的是无限流量套餐——就像美国AT&T独家首发iPhone时推出的那种——所有人都买了iPhone开始用起来,3G网络一开,大家开始看YouTube,整个网络就瘫痪了,因为根本没有足够的容量来支撑。有趣的是,到现在科技圈里还有人不懂蜂窝网络有边际成本。他们必须扩容,而扩容是要花钱的。运营商不得不手忙脚乱地调整成本曲线,使其与基础设施定价体系对齐、与底层成本对齐、并与用户感知到的价值对齐——他们通过分级套餐、合理使用条款、限速等方式大致实现了这一点。
但另一面恰恰就是我们现在看到的情况:你每个月付20美元,却能用掉价值上万美元的Token;反过来,如果你随便玩了两天,突然收到一张1万美元的账单,你肯定会惊呼这是什么鬼。现在你就能看到一模一样的新闻故事,这正是2008到2010年发生过的事,也和2001到2003年GPU领域发生的事情如出一辙。
但这个类比或比较中更有趣的部分在于:从那以后,移动数据流量增长了大约1500到2000倍。全球移动互联网网络的总收入大约为1万亿美元,每年CapEx约为2000亿美元,而ARPU已经20年没有增长。所有那些酷炫的新东西都是别人做出来的。运营商本来以为所有好东西都会由自己来建造——我曾在拥有银行牌照的电信公司工作过,因为他们觉得他们会自己做移动银行——这在现在看来完全疯了。但关键就在这里:他们建造了这套惊人的全球性、极其复杂、极其昂贵的基础设施,使用量不断增长,改变了所有人的生活,我们都在为此付费——可他们自己却没从里面赚到多少钱,因为所有价值都向上游转移了。
而这正是LLM面临的核心问题:模型本身能做完全部事情吗?还是需要在它上面建300个应用?你能不能直接对模型说"帮我把税报了",还是需要有一个报税软件,这个软件在内部用了10种不同的AI方式来处理?如果答案是后者,那么作为底层基础模型的提供者,你的定位又是什么?
它会不会变成一种以边际成本出售的商品性基础设施?目前来看这似乎是一个很难让人接受的概念。因为你现在能卖掉你能造出来的所有Token,所以你可以按ROI定价。但在未来几年,有大约1到2万亿美元的CapEx投入,模型效率每年提升100到200倍。还会有新的模型出现。模型会消耗更多还是更少的Token?我们会达到一个不同的均衡点。而当模型之间性能差不多、做同样的事情、用同样的芯片时,模型公司凭什么还能有定价权?
回顾历史:芯片公司没有捕获到价值,ISP没有捕获到价值,移动运营商也没有捕获到价值。Windows和iOS捕获到了,但它们在做的完全是另一回事:它们有各种杠杆可以向上游移动,还有网络效应,而模型没有。所以问题就在于:模型公司是像基础设施层那样收场,还是像操作系统层那样捕获价值并决定别人能做什么?讽刺的是,Netscape的故事正好说明了这一点——Marc Andreessen当年著名地宣称他要把Windows变成一堆调试得很烂的设备驱动程序,然后微软硬生生挤进了市场。但最终证明,网页浏览器本身不是关键——价值都在别的地方。所以这些像漩涡一样的大问题都悬而未决,最终又回到了我前面说的:有些事情你能知道,但你根本不知道它最终会怎么收场。
Erik Torenberg:是啊,现在还不清楚这会更像互联网(大部分价值和应用层面的更好利润率发生在应用层),还是更像云(价值似乎在硬件层,目前看起来Nvidia看上去赚得最多,利润率更高)。但它会不会一直这样?还是会变得更像互联网?要怎么开始预测这个答案?
Benedict Evans:对此我有两个回答。有大量关于历史如何运作的名言——我最喜欢的一句是:历史教会我们的只有一件事,那就是总会发生一些事,而且你总能事后解释为什么必然如此,但在当时并不明显。特别是我记得大约15年前,很多非常聪明的科技人士拿到了iPhone和Android,然后说:这是开放与封闭的又一轮较量,我们要干掉iPhone,但这当然没有发生。我可以事后解释原因,但所有这些类比都有用,却没有一个是预测性的。历史总是事后看来才显而易见。
有趣的是,我最近做了几个播客,也发布了这个演讲,然后就有一类评论说:Benedict,你没做好你的工作,你应该告诉我们未来会发生什么,你的职责就是做预测。可你看起来就只会说"我们不知道"。这里有两个问题。一个是在有些地方我确实说了我认为什么行不通、什么会奏效——比如我认为基础模型不是产品,聊天机器人也不是产品,价值会在上游。但另一个方面是,在这个周期阶段,存在太多变量,你不知道最终会是哪一个。如果你非要说"我觉得就是那个",你可能对,但你必须意识到其中的不确定性有多大,有多少条不同的路径可能走向。这就是这个阶段周期的本质:所有赌注都还是开放的。
等S曲线开始向上走,它就会收窄。曾经有一个时刻Windows Phone似乎也可能成功——事后看来当然不太可能。曾经有一个时刻移动端怎么走还不清楚,后来清楚了——这就是正在发生的事,然后我们就转向下一个问题。
科技的一个特点是:当你真正理解了一件事,知道了它是怎么运作的、未来会怎么走的时候,恰恰就是你该转向下一件事的时候了。你应该总是去寻找那些我们还不知道答案的安静角落。我的Apple电子表格我已经五年没更新了——因为我们早就知道结果了。我不在乎下一代iPhone长什么样,我也不关注他们在中国的市场份额了。结果已经定了,下一个问题。
Erik Torenberg:你刚才说你不认为基础模型是产品,你认为价值会向上游移动。请解释一下你的推理以及这可能会是什么样子。
Benedict Evans:我认为可以把三个或四个构建块放在桌面上讨论。
第一个是:目前来看,很难造出一个从根本上永远比别人好、还能持续保持差异化优势的模型。它没有网络效应,也没有你能拉的杠杆,或者像Instagram、YouTube、Google搜索那样的战略位置。LLM没有可对应的东西。当然,不同模型各有侧重——也许这个比那个好一点,也许你更喜欢这个,但它们之间不存在根本性的差异,唯一区别就是你愿意花多少钱。
第二个问题:聊天机器人本身就是一个奇怪的、功能有限的V1版UI。在某些场景、某些人和某些任务上它确实很好用,但大部分情况下你还需要一大堆别的东西。你需要工具链,需要正确配置,需要有合适的数据,需要配置好各种控制和用户界面。需要有人认真思考过这个工具应该怎么运作,因为擅长使用工具完成工作的人,和擅长决定工具应该做成什么样的人,通常是两拨人。
擅长平面出版物设计的人不是该去做InDesign的人,那是另一套技能。擅长理财咨询的人也不是设计理财机器人的合适人选——那需要不同的技能、不同的人。现在我们就在摸索中间地带:Claude有这个,Claude有那个,还有Skills等等。在我看来这就有点像,谁来做Skill?另一个问题是,这看起来有点像你在Excel里选"新建文件"时看到的模板——它们只能走到一定地步,到某个节点你就突破模板了。我的演示文稿里有一张幻灯片,引用了一个多年前在Twitter上有人对我说的话:他说自己当咨询顾问,一半工作是教别人用Excel来当数据库用,另一半是教别人用数据库来当Excel用。
所以这里有一个模糊的、混沌的地带:你需要专门的软件吗?你需要横向软件还是垂直软件?还是你就在Excel里搞定一切?我们都见过整个部门靠一个10兆的Excel文件运转的例子——我自己的生意也在用Numbers电子表格。但到了某个节点,你就会超越那个极限。
那么模型公司能做出所有这些吗?当然不能,就像微软或苹果不可能做出Windows和iOS上的每一个App一样。所以模型公司有没有那种杠杆效应?它们是Windows还是iOS?再问一次:有网络效应吗?
比如你现在是一家律师事务所,你要买一套软件——a16z投资过很多企业软件,这家律所或制造企业或银行会问"这个用的是Claude还是OpenAI?因为我们统一用的是Claude"吗?不会,根本不是这样运作的。云时代也不是这样,你不会说"我们公司统一用AWS",你甚至不知道某个SaaS产品跑在哪个云上。这才是关键,它被剥离掉了,不是你需要关心的问题。所以从这个意义上看,基础模型更像云服务商——它们可能有一些竞争优势,但没有那种杠杆效应,没有网络效应,没有控制力。
这也让我联想到另一种对比:半导体行业——每一代都越来越贵,参与者越来越少。综合来看,模型本质上是一种不同的商品,聊天机器人不是正确的UI或产品,模型公司不可能自己做出所有东西。所以它们是底层基础设施。那么它们有定价权吗?
未来会有大概3到6家公司做前沿模型,每年投入——没有人确切知道,大概是2000亿到2万亿美元——再加上一批边缘模型和开源模型。所以最终会有五六家公司在这个市场上相互竞争销售这些产品。价格纪律从哪里来?尤其是其中一些公司还有完全不同的商业模式。比如Google靠广告赚钱,他们对定价的态度跟OpenAI就不一样。
我认为难点在于:我们现在所处的状态和最终应该达到的状态之间存在差距——这其实是大一经济学课程就会讨论的话题。我们目前处于一个供需、定价、CapEx和容量之间的极端不平衡时期。但Token的需求是无限的,这并不意味着你无法达到一个不同的价格均衡点——因为移动数据就是这么走过来的。过去15年对数据比特的需求增长了1500到2000倍,但你仍然看到了供给和需求的市场价格均衡,而且在世界大部分地区仍然存在运营商之间的惨烈价格战。从根本上说,你销售的是一种商品,客户随时可以换供应商——开发者也会来回切换。
当然,我完全接受这可能是错的。也许最终世界上只有两家公司能造LLM,它们有定价权。或者我们进入一个世界,几乎所有事情都被融入了模型本身,模型在上游有杠杆效应。但我的核心观点是:就像iOS与Android之争一样——你当然可以说过去三次都这样走了,但不能证明这次也会一样。但至少你应该提出这些问题,也应该承认当前的状况是暂时的。我们正处在这种极端稀缺的状态中,随后会有定价体系、自由市场、以及大约1万亿美元的CapEx涌入。所以这些倍数都会发生变化。
Erik Torenberg:这正好引出了你之前说的"我们已经知道Apple是什么样了"。那么你目前最关注的下一个问题是什么?或者说我们应该最关注什么?
Benedict Evans:我们刚才已经谈过一些问题,比如模型的能力栈能走多远、模型能否实现差异化等等。另一个显而易见的问题是:在什么时间点上,我们会看到越来越多类别的用例中,模型已经足够好了,我们不再需要云上最贵、最快、最大、最重的模型?我们可以用旧模型、开源模型、或者设备端运行的模型。这正是苹果接下来要讲的故事——有多少东西可以推到设备端,在那里算力是免费的(或者至少对你来说是免费的,对开发者没有边际成本)。
另一个经典的问题是:问题本身已经开始走出技术领域了。比如你去看一家律所、一家咨询公司、一家投行——基本上所有传统上采用金字塔式结构的专业服务机构——如果你能自动化很大一部分金字塔底端那些人做的工作,会发生什么?我只能说,如果你没在律所工作过,没在贝恩、BCG、麦肯锡工作过,你大概不太可能搞清楚这是怎么回事,因为你可能根本不知道那些初级员工具体在做什么,也不知道客户到底在为什么买单。那些角色会怎样重构?AI对金融意味着什么?既包括内部的招聘结构,也包括你能创造的产品类型和利润率结构。对咨询行业意味着什么?对四大、三大、埃森哲、大型律所和广告公司意味着什么?
你大概能知道其中一些问题,但如果你不是这个行业的人,你根本不知道答案是什么。这让我想起在a16z的时候我常说的一句话"内容不是王"。我还写过"Netflix不是科技公司"——我想表达的是:Netflix的整个业务都是由科技行业打造的基础设施所支撑的。但Netflix面临的所有问题都是洛杉矶的问题(内容问题):选什么剧、拍多少剧、什么类型的剧?该花多少钱请人才?要不要冲奖?做不做电影?买不买体育版权?这些都是洛杉矶的问题,不是旧金山的问题。旧金山甚至不知道正确的问题是什么——它们是媒体行业的问题。Netflix所有真正重要的问题都变成了媒体行业的问题。
同样,特斯拉到底是汽车公司还是科技公司,也一直是争论的焦点。我想说的是:AI对法律行业意味着什么,这个问题既是技术人的问题,更多的是律师的问题——你需要深入了解律所实际如何运作、客户到底在购买什么。同样,生成式视频对好莱坞意味着什么?Ben Affleck可能比我知道得多得多——他创立了一家公司以几亿美元卖掉了。所以这是第二类问题:问题正在走出AI本身的范畴,变成了半AI、半其他领域的混合问题。
第三个层面——也许我早就该说——这一切与以往平台转型的根本不同之处在于:在3G、iPhone、网络等时期,你虽然不知道接下来会发生什么,但你知道物理限制。比如1995年,你知道电信公司下周不会给全世界都装上宽带;你知道不是全世界所有人都会去买一台PC,因为一台PC要3000美元。所以你知道基本的不可能边界在哪里。
但在生成式AI上,我们不知道。可能我们录完这期节目,手机就推送一条通知说OpenAI的新模型发布了,价格只有之前的2%——因为有了新的技术突破。我不认为这非常可能,但我们不知道这类问题的答案。模型会变大多少?变好多少?变快多少?变便宜多少?在哪些方面?模型的特征会如何变化?我们不知道。这和之前的所有平台转型都不一样——以前你知道基本限制条件在哪里。而这又会衍生出一系列新的问题。
某种意义上,我之前也提到过:目前唯一有产品市场契合度的领域是编程。其他领域还没有同等程度的PMF。我很安全地说:Anthropic的营收从去年的90亿美元运行率涨到了现在的470亿美元——这全部来自软件开发。所以,如果其他领域有人做出了一些能用的东西,会发生什么?
Erik Torenberg:比如律所、银行……如果你要猜的话,除了编程之外,哪些用例可能产生日常活跃的使用?
Benedict Evans:我几周前发布的演讲大概分为三个部分。第一部分讲的是资本、CapEx、基础设施和基础模型的差异化——这就是我们刚才聊的内容。第二部分是:你如何用这些东西来构建软件?这对软件行业意味着什么?软件会长什么样?利润率、公司格局会发生什么变化?
第三部分我称之为"变化"。我开头引用了Yogi Berra的一句名言:预测很难,尤其是关于未来的预测。我觉得有一个回测视角挺有意思:想象一下在1997年问关于互联网的这类问题,你会得到什么?不会得到什么?我认为一个看待方式是:这是一种自动化,它把过去人们做但不能自动化的一类事情变成了可以自动化。那这意味着什么?我提出了三四个可以按下的按钮。
首先是价格弹性,这也是Gerber的PowerDNS真正在做的:如果做事的成本降低了,你是用更少的钱做同样多的事,还是用同样的钱做更多的事?还是因为你做得更多、收的钱也更多?有没有什么事以前做不了,现在变得便宜了?有没有什么事以前很贵,是进入门槛——就像拥有印刷机对于报社那样——现在这个门槛消失了?有没有什么事因为你成本降低而在商业模式或竞争空间中解锁了新的可能?
最后一个问题是:有哪些事情以前是完全不可能的,完全由于成本过高而根本没人想过,现在变得可及了?我常用的例子是蒸汽机使火车成为可能,你买再多的马也造不出一列横贯东西的火车。更现代的例子是YouTube或Spotify。Spotify说:看看过去25年音乐行业的历史,前半段是"你不用花1.5美元买一张CD就为了那一首歌",后半段是"每月15美元就能听所有你能找到的音乐",这在以前是完全不可能的事。
这类预测的问题在于:一方面你耍耍小聪明说一些显然正确的话,但你其实不知道它在具体行业里意味着什么。比如90年代末我们说互联网会摧毁物理分销的价值——这对报纸和电影公司意味着完全不同的事情:报纸被摧毁了,而电影公司几乎没受什么影响。所以还是看具体情况。
还有一部分我觉得可以问一些更有用的问题。让我比较好奇的一个是:AI会如何改变广告、电商、品牌和我们的消费行为?广告是万亿美元的市场,零售是25万亿美元,这是一个相当规模的可触达市场。我一直在想的是:Google、Meta和Amazon其实并不真正知道那些商品是什么。它们知道SKU,知道发布者在元数据字段里输入了什么,知道"买这个的人也买了那个",但它们不知道为什么,也不知道那些东西到底是什么。所以才会出现这种笑话:Amazon,我买了一个马桶垫圈,但我不是在收集马桶——因为Amazon其实不知道马桶垫圈是什么,也不知道正常人不会买两个。实际上它们应该能用频率分析知道,但它们没这么做。而用LLM,原则上你就能知道那些东西是什么、人们为什么买、人们还会买其他什么东西。
当然"知道"这个词很难定义。但至少AI系统能提供一种完全不同维度的统计色彩——这就是为什么Google和Facebook的广告收入和转化率每个季度都在飙升——他们把AI融入了广告系统、推荐引擎和预测算法。你会看到更多你喜欢的东西,你看到的广告也更可能是你想买的东西。所以他们的广告收入出现了突然的加速。
总的来说,你看这些系统现在的运作方式:它们说"买那个的人也买了这个"。而现在你应该能做到了:这里有一件外套的图片:这是什么?在哪里能买到?十年前这绝对做不到,五年前可能也做不到,现在应该能做到了。然后你还可以说:帮我推荐10件类似的外套,不同价位,告诉我哪里能买到,并列出每件的优缺点,这些你也基本能得到。再进一步:看我的Instagram,帮我推荐一件我该买的冬季外套,要改变我的风格,但不能变得太多。三年前这完全是科幻小说,现在你会觉得确实可以做出一个差不多能用的东西。
而这些变化——计算机能知道什么、能自动化什么、能提出什么建议——又回到了最根本的问题。每次有新技术出现,你首先会用新技术做旧的事情:更多的电子表格、更多的PowerPoint、更多的邮件、更好的邮件。但重要的不是更好地做旧事,而是做那些旧技术根本做不了的新事。这是个很老套的观察,但我们常常忘记。那么有哪些事情是你只能用这个新东西来做,而不仅仅是自动化旧的东西?
企业端的版本可能是:你录下了所有与客户的Zoom通话,你有Salesforce中所有的邮件流,你还有所有用户行为分析数据和指标。那么你该怎样调整定价来改善流失率?这就是LLM可能做到的,跟"对呼叫中心做情感分析,告诉我哪些客户在生气"是两回事。你在分析能力的抽象层次上发生了多重转变。当然,这会催生新公司、摧毁旧公司、创造新业务。但话说回来,我们现在是1997年,而我想预测出Uber和Airbnb。如果我真的能预测出来,那我们就活在平行宇宙了。风投的命中率就不会是十分之一,而是十分之十了。
Erik Torenberg:是的。我们现在问的问题之一是:什么东西以前贵得离谱,现在变得可能了?比如从零重建YouTube?或者重写Linux内核?
Benedict Evans:有趣的是,另一面的观察是:新来的公司总是说"我们要用新东西重新做一遍旧东西。当然,我们要用开源重做Office,我们要在Web上重建它。"结果呢?看看Google Docs,市场份额大概20%——因为那根本不是关键。
真正有意思的是做出一些全新的东西,是转移抽象层次,去发现那些以前根本不存在的问题。坐在风投公司里整天听项目路演,你会发现有些东西听起来有点用,有些东西你觉得不太可能成。但有一些东西就像填补了宇宙中的一个空洞——当别人跟你一解释,你立刻觉得:哇,为什么以前没人做过?为什么没人发现这个问题存在?这就是看创业公司最好玩的地方。而这正是人们会用AI来做的事——人们会突然发现一种方法,意识到某个问题一直存在,而包括那些拥有这个问题的人在内,没有人意识到那个问题存在,然后他们就会去做一个工具来解决它。
这也回到我前面的观点:这就是为什么我不认为模型能包揽一切。回想一下你在a16z见过的所有项目路演,有多少是行业里的人早就知道那个问题存在的?答案往往是否定的。实际上行业内没人觉得那是个问题,通常需要花两年时间去解释,让他们相信那个问题确实存在,然后这个新东西才能帮他们解决。这就是问题所在,你不能指望一个财务部门的普通经理用这个工具去解决一个巨大的全球性行业问题——因为根本没人知道那个行业问题存在,更不用说想出正确的工具方案了。
Erik Torenberg:这是否意味着AI时代的SaaS环境会比以前更加不集中?更少捆绑,少一些像微软企业套件那样的巨头?
Benedict Evans:回到SaaS的话题。让我们把一些构建块先放好。显然,构建软件会变得更加便宜、更加快速。显然,会出现一大堆用软件能做到而以前完全做不到的事情。因此竞争会更激烈。当然,这也伴随着新的利润率结构。但正如我们刚才聊的,我们并不真正知道那个利润率结构会是什么样。
会走向结果导向定价吗?把企业软件中的每一次按键都和损益表挂钩非常困难,有时在Salesforce里可以做到,但绝大多数软件很难说"我今天做的工作对每股收益产生了这么多影响,所以我们应该为此付这么多钱"。我不认为这说得通,至少长期来看说不通。但定价结构会怎么演变?肯定会有更多竞争,构建软件会更容易、更快速。
我思考这个问题的方式有两个有用的框架。第一个是:看看当今的企业软件群体,有三大类。第一类是大型横向系统——SAP、Workday、CRM、人力资本管理软件、薪资管理软件等等。第二类是垂直软件——一家典型的大型美国公司大概有300到400个SaaS App,另外还有上千个内部购买或构建的App跑在Teams上。中间地带则是Excel、邮件和共享文件系统构成的模糊的即兴空间,东西会在这三者之间来回移动。原则上说,每一个SaaS App都在做你本来也可以在SAP或Excel里做的事情,比如你可以在Workday里管理校招。
但到了某个节点,比如我跟人聊过,如果你是普华永道,每年要招几千个毕业生培训成会计师,你可能有一套自建的专用软件,或者你请了埃森哲来建一套,而且你可能还很讨厌它。但如果你是一家每年只招5个毕业生的公司,你就在邮件和共享Google Sheets里搞定,因为你为什么专门买套软件?中间地带则可以用Workday、Excel或专用App来做。现在你把ChatGPT加进来:你是用LLM来做这件事?有没有一个LLM工具能让你在Salesforce里完成以前不能做的事?或者在你的垂直软件里完成以前不能做的事?你用LLM给自己建一个工具——就像公司里某个部门靠一个15年前建的10兆Excel文件运转,没人知道它是怎么运作的,但大家还在用。所以LLM就进入了这个广阔、零散、复杂的景观中,成为完成任务的另一组选项。
我认为另一个思考框架是:LLM是放在栈顶还是栈底?一方面,放在栈底就是Salesforce内部的一个功能,你在Salesforce里,系统查看与该客户的历史记录、所有其他销售通话的上下文、业务目标,然后帮你生成一封邮件或建议你在给客户打电话时该说什么。这是一个受控的功能,有工具链、有护栏,由该特定用例驱动。另一方面,就是刚才那个例子:去查看Salesforce、Workday、所有邮件和Google Analytics的数据,然后综合出一个以前做不到的分析。所以两难的境地在于:你把概率性的、可能出错的软件放在哪里?你把确定性的系统软件放在哪里?数据库放在哪里?LLM放在哪里?是栈顶还是栈底?可能两者都有,取决于你具体在做什么。
归根结底,这是对软件意味着什么——更多的软件,远远更多的软件。所有软件公司存在的意义就是解决其他软件公司创造的问题。这就是那个经典笑话:所有安全软件存在的意义就是解决其他安全软件创造的问题。显然,SaaS时代已经让我们经历了一次数量级甚至两个数量级的软件爆发。这次我们应该预期同样的事情发生。
至于说SaaS末日,投资者看着所有这些公司说,我们不知道哪些公司会被这一切搞垮。肯定有一些公司会完蛋,一定会有一定比例的现有SaaS公司被这波浪潮消灭,但你不知道是哪些,所以你不应该直接把整个行业贬低50%。但你肯定要说:在我搞清楚这一切到底是怎么回事之前,我暂时不会All in做多SaaS。
Erik Torenberg:你在和Ben Thompson的对话中提到:软件就是有人坐下来设计了一个工作流,然后说从今以后这就是做这件事的正确方式。但你也说流程是从业务运作方式中长出来的。这需要时间吗?还是我们需要更多的实验和迭代——来自那些垂直AI初创公司——才能找到未来软件的正确形态?
Benedict Evans:从某种意义上说,战略咨询公司和软件公司做的事情有一个有趣的重叠:它们都观察一家公司内部正在发生的事情,说"这样做太糟糕了,换一种更好的方式能达到你的目标"。软件公司把这套方式编码进软件里,战略咨询公司则把它编码进工作流、岗位职责、流程、培训和目标中,也可能建议他们买一套软件来做这件事——或者现在越来越多地,直接帮他们构建那套软件。
还有一点需要谈的是:一家组织内部有多少工作是隐性的、没有文档记录的、不在训练数据中的、不是公司里随便哪个人能坐下来画出一张流程图向你解释清楚的。这在BCG和麦肯锡的价值中占了很大一部分。他们有权进入一家公司,跟所有人谈话,包括那些在不同部门、不被允许互相交谈的人(以及不会因此被解雇的人),去搞清楚"这件事实际上是怎么运作的",而不是"它应该怎么运作";以及为什么人们没有在执行战略,因为实际上他们的奖金目标取决于他们不去执行那个战略。然后他们作为外部团队给你答案,你就可以把责任推到他们身上。
这些都是组织管理和人员运作中的问题——人们如何运作、如何解释自己做的事——这些很难写下来,也很难直接烘焙到一个Skill里说"给你,也许做个PPT吧"。所以这里有一个更大的挑战:如何让人们使用这些技术?如何让用户采纳新工具?如何帮助人们采纳新工具并找出可以用它们做的新事情,这同样发生在云、Web、移动、互联网、PC和电子表格时代。
Erik Torenberg:你认为AI原生软件和新型界面之间会不会有一种共同演化?比如新的客服AI平台可能不需要那么多面向人的UI,或者记录系统软件干脆没有前端?因为它主要的用户是直接查询它的AI Agent?
Benedict Evans:这些都是很有意思的想法,我很难有强烈的意见,因为我没有深入到企业基础设施如何构建的细节中去。我好奇的是这些问题有多新。我记得大概10到15年前Chris Dixon说过:API就是新的边界,软件不再需要软件公司了,你只要开放你的API就行。所以,旧的东西总会以新的形式回来:现在你不需要API了,你只需要一个MCP服务器,Agent就会直接连上去。我不知道。
我认为这类事情的最大挑战在于:所有决策本质上都是异常处理。问题永远是:什么是你不能自动化的?什么需要有人来做决策、做判断、有自己的意见——因为那件事可能从来没有被写下来,没有发生过,或者看起来和以前不一样。
我在演讲里用的区分方法是:任务和职位的区别。用来完成某个职位的任务可能会改变,但职位本身可能变化不大,或者这个职位向客户交付的东西变化不大。想想50年前的会计师和今天的会计师——他们做的最核心的事情几乎没有一件是相同的。但在客户看来差不多是同一件事,只是用完全不同的方式、通过一系列完全不同的任务来完成。
我认为更深刻或更抽象的一种思考方式是:在哪些地方你希望App给出的是"所有人都这样做的答案"?那是每个人都想要的答案,任何人都会给的答案,任何初级员工都会做的答案,任何人都会给我的答案。而在哪些地方你不想要这种答案?在哪些地方你想要的是一个新问题的答案、一个不同的答案或不同的想法?因为LLM会非常擅长任何你能描述人们怎么做、以及你想要的就是一般人会怎么做的事情。在不擅长的地方,是你无法解释你为什么要那么做、而你做的又和别人不一样的地方。
Erik Torenberg:包括Google CEO在内的很多人都说,投资不足的风险比过度投资更大。有没有一个CapEx水平会让这句话不再成立?我们现在是不是正在接近那个点?
Benedict Evans:首先存在一个财务引力的问题:微软、Meta和Google今年的CapEx都达到了收入的50%左右。电信行业被认为是资本密集型的,但它们的CapEx只有收入的15%到20%。四大公司今年的指引是7000亿美元。电信行业总共是3000亿,移动是2000亿。石油和天然气,取决于怎么算,大概在7000亿到1万亿美元之间。所以一年7000亿美元并不是一个不可能的巨大数字——这就是大型全球基础设施的正常成本,只是钱确实很多。
显然,这些公司明年不可能花1.5万亿美元,如果真花了,它们就得借钱,而且不可能长期维持这个支出水平。所以到了某个点,增长必然放缓,因为没有更多的钱了。当然你可以谈ROI、谈投资回报能力。资本市场也愿意在某个范围内提供资金。但随便说一个数字——我们不可能每年在AI基础设施上花10万亿美元——因为全世界根本没有10万亿美元可以花。所以存在某种物理上限。
我目前还不太敢说比这更具体的东西。我几乎要回到最初说的:我们现在有一堆倍数的问题——需求远远超过供给。但另一方面,效率也在大幅提升。我们不知道下一个模型会是什么样。我们不知道边缘计算和开源模型什么时候会加入战局。而且你永远在追逐最新的模型。这就是贯穿一切的主线,一个模型只在3到6个月、6到9个月内保持相关性,而它花了几十亿美元和多少基础设施才能做出来。
我认为这个局面还没有真正稳定下来。显然有很多非常聪明的半导体分析师在花大量时间试图给这些数字赋值——这有点像90年代末给互联网带宽估值——你甚至不知道电子表格里的行是什么,更别提值是多少了。你只能说不可能是无限的,存在物理限制。
另一个回答方式:如果你是Google、Meta、微软、亚马逊或苹果,这在一定程度上是一个关乎存亡的问题。你有一种FOMO问题。一方面,你当前的投资回报非常正面。另一方面,你不能让别人在你缺席的情况下跑掉,否则公司就完了。你不想像2000年代的微软、90年代的IBM、或者2010年代的Intel那样,一直被苹果打得落花流水。如果这就是计算生态的未来,你必须参与。但同时,CFO坐在那里说:行,但我们要参与到什么程度?显然到了某个点,CapEx的增长必须放缓,因为你根本拿不到那么多钱。
Erik Torenberg:会不会有一个关于Token浪费的清算时刻?有没有可能公司过度使用了AI,等他们做正式的ROI研究时就会缩减?
Benedict Evans:显然,有的人用最贵的模型在网上聊天——就像2010年移动端那样,你收到一张1万美元账单,然后说"等等,我以为这是无限流量套餐"。所以肯定会有一些又傻又痛的段子。但我认为更有趣的问题是:正如我已经说过好几次的,我们正处在一个严重失衡的庞氏时刻,定价必须重新与成本对齐,使用量必须与定价和ROI对齐。
难点在于,在这个早期阶段,很难知道ROI是什么。这有点像90年代末互联网,你说"去变得更有效率吧"。如果你看我的演讲里引用的德勤和美联储的调查——你去问CFO们是否看到了收益,目前大部分收益是那些很难量化的东西:更精准的分析、更好的客户支持、更高的生产力、你能更快地做更多幻灯片、更快地做分析。要在财务上给它赋值很困难。它有财务价值,但和你说的"我们用AI做出了新产品,带来了多少收入,或者节省了多少钱"不是一回事。要建立一条新的收入线,远比发给所有人用AI来做Excel要快。
另一个答案当然是消费者剩余——就像Excel当年那样。如果做一份DCF估值模型需要一周,你可能只做一到两个。如果做一份只需要10秒,你能做50份——但你没办法为此多收费。所以一部分结果是,这些变成了竞争必需品——每个人都必须买、必须用。但你从中获得的成本节约或生产力提升,会被竞争吃掉。你没办法多收费。
如果你是麦肯锡、贝恩或BCG,某个分析以前需要一周,现在只需要一天,你可能会做5倍的分析量,但向客户收同样的钱。你的成本结构也没变,这就是投资银行和财务分析领域曾经发生的事:你用更少的人做了多得多的分析,向客户收取同样的费用。
Erik Torenberg:你论文的核心观点之一就是模型最终会成为商品。然而目前融资速度最快、金额最高的领域恰恰就是这些基础模型公司。对此,你对它们有什么建议,无论是整体性的,还是针对某一家?
Benedict Evans:我并不确定它们一定会变成商品。我的立场更像是:这里有一串推理链条,确定性地看,这些东西看起来很可能变成商品——那么请解释给我听为什么它们不会。我就只承诺到这个程度。至于筹集这么多钱,我回到之前关于移动行业的观点,这虽然不具预测性,但是一个值得注意的观察:移动行业规模非常大,花了很多钱,但利润并不高,所有酷炫的东西都是别人做的。
然后你可以看看资本回报率,答案取决于你是在美国、欧洲、印度还是中国。但与此同时,这件事值得做,也确实为某些人带来了回报,但最终移动运营商并没有掌控全局,其他人从中获得了更大的价值。Google去年的净利润是多少?大概500亿美元?整个电信行业的净利润是多少?我应该去订阅Bloomberg终端才能直接回答这个问题,但我可以很有把握地说,Google、Meta、Amazon、微软、苹果的利润总和超过了整个电信行业。
所以这是一个谜题:你在推动前沿前进,你陷入了一个陷阱,你必须不断竞争,否则别人就会做出来,你就会落后。还有一点我们完全没谈到的是:我们是不是正在造AGI?我们是不是要造一个"神盒"?有些人已经相信了,虽然很难分析,但也许就是这样。所以无论如何你会继续建造下去。
但实际问题是:你怎么做出人们想用的、不是软件的东西?软件是个好生意,但它是唯一的生意吗?如果花几千亿美元让软件行业更高效,那很好,那值1万亿。然后呢?你怎么把它扩展到经济的其他部分?扩展到所有其他人?所以你才会看到这些讨论——与私募股权合作、与咨询公司合作——正如我们刚才讨论的,如果你在经营一家实体公司,要搞清楚用这些东西做什么其实很难。所以你会去找贝恩、BCG、麦肯锡、Infosys、Cognizant、IBM、埃森哲或者私募股权股东。所以一方面,你在造越来越大的模型,你觉得你必须继续做下去。但另一方面,人们到底在用它做什么?为什么大多数人打开ChatGPT,今天还是想不出有什么好做的?
Erik Torenberg:最后一个问题:你的演讲里有没有什么你特别希望听众记住的内容?
Benedict Evans:我去年用过、今年也用了的是一张IBM的广告,来自50年代初,画面上是一大群工程师举着计算尺,广告文案写着"一台IBM电子计算器相当于150名专业工程师"。你在a16z见过多少张这样的幻灯片?我们记得每当这些基础技术变革发生——每10年、15年或20年一次——它们都会带来惊人的变化,彻底改变一切,而且完全不同于以前发生过的任何事情。所以AI是惊人的、变革性的、完全不同于以前发生过的任何事情。
但移动也是很大的变革,互联网也是,PC也是,计算机本身也是——所有这些在当时也都是非常大的事,而且当时也很难预测接下来会发生什么。所以我们作为一个基准情况应该假设:好吧,我们又要经历一次了。这会产生一堆毁掉人们生活的东西,会让一批人失业。会有一些我们不太高兴的事情,也会有一些我们都觉得很棒的事情。20年后,我们会忘了曾经有一个世界,计算机做不到那些事。
我们现在就在这个通话里坐了一个小时,电脑没有崩溃,我们还在互相传输高清视频。当然它能正常工作,事实上我还在用iPhone做到这一点。我的iPhone在通过WiFi向我的Mac传输视频,就像魔法一样,而我们再也不觉得有什么了不起的。我想这就是我对我所认为这一切终点的描述:它会变成魔法,20年后,我们会说:当然了,电脑一直都能这么做。
Erik Torenberg:这是一个很好的收尾。这份演讲叫《AI Eats the World》,在Benedict Evans的网站上,内容非常精彩,还有很多我们没来得及聊的内容。Benedict,这次对话非常棒,非常感谢你来做客。
Benedict Evans:谢谢,聊得很愉快。
原文章:The Economics of AI Usage and What's Next For SaaS | Benedict Evans on a16z
链接:https://www.youtube.com/watch?v=ktl8mNiWqMM
编译:Yanlin Hang
声明:本文由入驻金色财经的作者撰写,观点仅代表作者本人,绝不代表金色财经赞同其观点或证实其描述。
提示:投资有风险,入市须谨慎。本资讯不作为投资理财建议。
比推BitpushNews
腾讯科技
Z Finance
戈多GodotSancho
C Labs 加密观察
刘正要律师
刘红林律师
