免责声明:金色财经所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(jinse.com.cn) 举报

    对情报的需求近乎无限 但代价不菲

    文章作者:Bryan Daugherty 文章编译:Block unicorn

    长期以来,自从 OpenAI 将大型语言模型普及到千家万户以来,人工智能就像一个可以随意把玩的新玩具。直到新模型开始消耗大量能源和资源后,人工智能达到其性能极限的现实才被许多人意识到。

    即使在我们编辑的电话会议和人工智能论坛的讨论中,每一个新模型总是促使人们竭尽全力去利用它并比较结果。大多数参与人工智能模型讨论的人很少关注这样一个事实:思维模型的每一次微小改进都会不成比例地增加单位成本,而产出往往只是相似或略有提升。

    更优秀的模型意味着你更快地用完了每日代币限额,查询和提示次数也更少。这几乎立即改变了用户的行为。即使在我开始更频繁地达到每日限额之后,我仍然使用人工智能,但我会更加谨慎地根据我想要执行的任务来选择模型。

    额外的决策虽然令用户感到恼火,但也引出了一个更深层次的问题。数万亿美元的资本支出涌入人工智能行业,大量数据中心拔地而起,以及对计算型企业投资组合的大量投资表明,对智能的需求是无限的。但大多数人和公司只有在有明确的目标需要达成时——例如提高写作速度、优化代码质量、增加销售额、为客户提供支持、降低成本或辅助决策——才会反复购买智能资源。

    因此,认为对情报的需求近乎无限是一个错误的假设。

    在今天的文章中,德尔福实验室首席运营官凯文·西姆巴克对此进行了清晰的阐述。对智能的需求可能非常巨大,但并非在任何价位上都是无限的。只有当有用工作的成本降至买家能够接受的水平以下时,这种需求才会接近无限。

    我一直坚持一个假设,但只有少数人开始公开表达出来。

    整个科技产业的建设——数据中心、芯片、超过万亿美元的承诺资本,以及如今与此息息相关的、不断增长的股市份额——都建立在一个信念之上:对智能的需求是无限的。

    并非如此。对情报的需求近乎无限,但代价不菲。正是这个限定条件决定了最终结果。

    今年上半年,我们基本忽略了价格因素,而是专注于情报收集。这一点从 Anthropic 的营收数据中可以明显看出。

    我们甚至创造了一个新词“ tokenmaxxing”,来炫耀我们无限制的消费。

    对大多数公司而言,这种做法根本不可持续。公司需要找到投资回报率,否则它们必然会抑制需求。

    今年上半年,我们成功说服首席财务官放松了财政预算,但下半年我们将不得不重新收紧预算。

    本文将深入探讨这一论点,讨论如何应对,以及如果我们犯错会发生什么。

    无人绘制的需求曲线

    “近乎无限的需求”和“无限的需求”听起来似乎是一回事,但实际上它们是两种完全不同的经济模式。

    无限需求是一条垂直线。它表明:人们会以任何价格购买智力,所以唯一重要的就是生产更多的智力。

    只要不断扩大供应规模,需求早已存在。目前大部分资金的投入都基于这样的假设。

    你听过多少人说过:“如果 Anthropico 拥有更多的计算能力,他们的年度经常性收入就能达到 1000 亿美元?”

    近乎无限的需求曲线是一条向下倾斜的线,其下方有一个硬底。它表明:对情报的需求会爆炸式增长,但前提是价格必须跌破买家能够获得回报的水平。

    uvfSyJ4mSL1dCD4k1dS5hnS5ppqGR37YoXE5RLti.png

    在投资回报率(ROI)线以上,需求疲软且波动较大;在 ROI 线以下,需求几乎为零。ROI 线就是底线,一家公司相对于 ROI 线的位置决定了一切。

    这不应该被视为无稽之谈,但许多人却认为需求曲线是垂直的。

    实际买家告诉我们底线在哪里。麻省理工学院去年的一项研究发现,只有约 5% 的企业生成式人工智能试点项目产生了快速、可衡量的财务影响。其余项目都停滞不前。

    今年一项针对全国高管的大规模调查发现,近 90% 的公司表示,人工智能在三年内对生产力或员工人数没有产生可衡量的影响。

    通常的回应是将此称为“技能问题”,并想当然地认为公司最终会解决这个问题。

    这或许没错;或许我们只需要在企业内部部署更多 Anthropologie 和 OpenAI 的前线部署工程师 (FDE),就能真正实现投资回报率。这似乎正是新兴“部署公司”所押注的。

    但很难假设这两件事能同时成立——要么对情报的需求是无限的(在这种情况下,实验室为什么需要部署公司?),要么需求接近无限,但只有在合适的条件下才会如此。

    2oh9ZVAViEr5lYmwJhsZBJlTA3fzwopNTf3UAE8Q.png

    Tokenmaxxing:针对您自己的客户进行优化

    这有点是咎由自取。

    整个行业的普遍做法是,对于每项任务都采用最大的模型和最深层的推理设置。

    如果你把这件事交给用户来决定,你就会得到这样的结果——他们会把所有东西都用 Opus 4.8/GPT-5.5 处理,因为,为什么不呢?

    但这种行为会悄无声息地扼杀投资回报率。

    最新的推理模型让代币销毁变得如此容易。它们在给出答案之前会生成冗长的内部逻辑链,而你需要为每一个隐藏的代币付费。

    一个返回几百个可见单词的请求,实际上会消耗数千个计费代币,这意味着每个有用答案的实际成本可能比贴纸上显示的成本高出一个数量级。

    在一项对照评估中,顶级推理模型在执行相同任务时,成本大约是成本较低的通用模型的 14 倍,且失败次数是后者的四倍。不加选择地应用最高智能水平,反而导致成本更高、性能更差。

    更深层次的问题是激励机制不匹配——卖方按代币支付报酬,而买方按交易结果支付报酬。

    代币最大化策略最大化了第一个目标,却削弱了第二个目标。它把每个决策的价格推高到需求曲线的上方,使其远离需求实际存在的底部,而这恰恰是整个系统需要将价格拉低到底部的时候。

    你不可能通过向所有人出售最昂贵的产品来满足近乎无限的需求。你应该将足够好的解决方案的价格控制在投资回报率范围内,然后让销量来满足需求。

    为什么“成本总会下降”并不能解决问题

    我知道你现在很想说“杰文斯悖论”,但这并不能让你脱身。

    首先,需要降低的成本是每次有效结果的成本,而不是每个代币的成本。这两者之间可能存在关联,但前提是我们必须解决上述行为问题。

    如果代币价格下跌,而代币最大化又加速推高每项任务的代币消耗,那么完成实际工作的成本根本不会下降,甚至可能上升。

    单价下跌与账单上涨并存,我听说有些球队现在就正在经历这种矛盾。

    其次,节省的成本必须真正惠及买家。如果效率提升完全被卖家攫取,或者浪费在不必要的理由上,就永远无法达到投资回报率,也就无法满足市场需求。

    如果降低了模型的代币成本,但底层推理和工具调用却增加了代币消耗量,那么结果本身是否变得更便宜就很难说了。

    这是市场问题,而不是采购问题。

    如果仅仅是企业软件令人失望,那倒也没什么大不了的。但如今,全球经济的大部分筹码都押在了“人工智能贸易”上,所以任何一点失误都可能造成巨大影响。

    美国主要的超大规模数据中心运营商将在 2025-2026 年支出超过 1 万亿美元。这项支出是基于对未来收入的预期,而未来收入取决于企业采用率,企业采用率又取决于投资回报率。

    资本支出与收入之间的缺口正通过融资来弥补,其中一些融资方式看起来相当循环往复。我目前还不认为情况会很严重,但我们需要将这一切与需求曲线联系起来。

    最简单的理解是,如果需求并非无限,而是接近无限,并且受到尚未实现的投资回报率的限制,那么最大的风险就是能够证明资本支出合理的收入无法按时实现。

    融资循环不可能永远替代真正的现金流。一项杠杆率如此之高、集中度如此之高的技术,如果未能达到预期效果,必然会引发重大的经济震荡。

    坦白地说,如果投资回报率没有大规模显现,人工智能交易就会开始瓦解,而一个自发的、循环的、集中的结构会按照它构建的方式瓦解:迅速地,并且同时影响到所有人。

    这是最糟糕的情况。我不是说这是最有可能发生的情况,但这种情况的开端是企业对试点项目不满,并开始限制需求。

    “投资回报需要时间”——没错,而这恰恰是危险所在。

    对投资回报率问题最严重的反对意见是时机问题。

    任何通用技术都会有滞后性,而且这种滞后带来的回报可能是实实在在的。但它的滞后性可能不会像驱动市场的季度周期那样显现出来。

    这种不匹配体现在组织重组缓慢的运作方式与资本市场快速运转的融资结构之间。

    这项技术可能带来长达数十年的真正变革,而在此期间,贸易融资可能会中断。两者可能同时发生。

    这就是为什么时间是这里最稀缺的资源,也是为什么我们需要抓紧时间的原因。

    投资回报率目前的样子

    情况并非完全黯淡,而且这也不是我希望大家得出的结论。

    有些企业现在确实获得了切实可衡量的回报。但是,在很多情况下,这些企业并非是那些追求最明智模式、并致力于最广泛授权的团队。

    它指的是团队执行范围窄、有界、可重复的工作量,采用适合工作的模型,并对结果进行实际衡量。

    投资回报率体现在那些部署智能路由的公司中——将简单的查询发送给低成本的模型,只将复杂的查询升级处理。

    投资回报率体现在那些将前沿模型替换为针对大量结构化任务的小型、精细化模型的团队中。

    投资回报率体现在那些采用提示和上下文筛选工具来减少用户将所有内容都发送到最昂贵、推理能力最强的模型的企业中。

    投资回报率体现在构建自定义代理框架的项目中,这些框架可以管理工具访问、内存、权限、工作流状态、评估、日志记录、人工审批、回退机制和成本控制。

    这些都不是人工智能能力较弱的例子。它们只是同样的结果,但结果却低于投资回报率线,而不是高于投资回报率线。

    早期的成功者,那些获得投资回报的人,都遵循一个原则:每一美元都追求智慧,而不是不惜一切代价追求智慧。

    重新定义

    tokenmaxxing 的整个前提衡量的是错误的数字。

    决定整个人工智能交易是否可持续的数字是每美元的收益。

    已交付的有效工作量除以交付成本。这个比率决定了某个用例是从投资回报率(ROI)线以上跌落到线以下,而线以下等待的需求量是唯一足以证明已投入资金合理的因素。

    因此,当务之急,真正紧迫的工作,就是以足够快的速度大幅降低每次结果的成本,从而将大量搁置的用例纳入考虑范围,并在市场失去耐心之前让这些方法得到采用。

    主要杠杆已经存在:

    • 将每个任务分配给能够实际完成该任务的最便宜的型号,而不是默认分配给最贵的型号。

    • 精简上下文和推理,使其只包含任务所需的内容,而不是把所有内容都塞进最大设置下的最大模型中。

    • 将代理封装在控制工具、内存、评估、审批和预算的框架中,这样可靠性就来自系统,而不是来自蛮力模型的大小。

    • 使用专有数据对较小的开放权重模型进行微调,以处理不需要尖端技术的高容量、可重复性工作负载。

    每一种方式都是以更少的成本完成同样的工作,而只有这样才能将近乎无限的需求转化为实际的成果。

    乐观地看,这一切表明市场需求确实存在。它非常巨大,蓄势待发,而决定其成败的关键因素只有一个——投资回报率。我们只需要齐心协力,尽快促成此事。

    jinse.com.cn 0
    好文章,需要你的鼓励
    jinse.com.cn 0
    好文章,需要你的鼓励
    参与评论
    0/140
    提交评论
    文章作者: / 责任编辑:

    声明:本文由入驻金色财经的作者撰写,观点仅代表作者本人,绝不代表金色财经赞同其观点或证实其描述。

    提示:投资有风险,入市须谨慎。本资讯不作为投资理财建议。

    金色财经 > Block unicorn > 对情报的需求近乎无限 但代价不菲
    • 寻求报道
    • 金色财经中国版App下载
      金色财经APP
      iOS & Android
    • 加入社群
      Telegram
    • 意见反馈
    • 返回顶部
    • 返回底部