免责声明：金色财经所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（jinse.com.cn）举报

Galaxy：AI Agent链上屡次陷入困境根源何在？

金色财经

刚刚

作者：Zack Pokorny，Galaxy Digital助理研究员；来源：Galaxy Digital；编译：Shaw 金色财经

引言

人工智能智能体（AI Agent）的应用场景与能力已开始逐步演进。它们正逐步实现任务自主执行，相关研发也在推进智能体持有并配置资金、发掘交易与收益策略等功能。尽管这一实验性转型仍处于极早期阶段，但其发展方向已与过往截然不同 —— 过去的智能体大多仅作为社交与分析工具使用。

区块链正为这一演进过程提供了天然的试验场。区块链具备无许可特性、可组合性（即同一执行框架可承载各类金融基础组件应用），拥有开源应用生态，向所有参与者平等开放数据，且链上所有资产默认支持可编程化。

这便引出了一个结构性问题：既然区块链可编程且无许可，自主智能体为何仍会面临运行阻碍？答案并不在于执行是否可行，而在于执行层面之上需要承担多大的语义理解与协同调度成本。区块链可确保状态转换的准确性，却通常不提供协议原生的经济解读、标准身份或目标层级调度等抽象能力。

由此产生的部分阻碍源于无许可系统的架构特性，另一部分则源于当前工具、信息筛选与市场基础设施的发展现状。在实际应用中，诸多上层功能仍需依托以人为操作核心设计的软件与工作流程来实现。

区块链架构与人工智能智能体

区块链的设计核心围绕共识机制与确定性执行，而非语义解读。其对外提供的是存储槽、事件日志、调用追踪等底层基础组件，而非标准化的经济对象。因此，持仓头寸、收益、健康系数、流动性深度等抽象概念，通常需要由索引器、分析层、前端界面与应用程序接口在链下重构，将各协议专属的状态转化为更易用的形式。

诸多主流去中心化金融操作流程，尤其是面向普通用户与主观决策类的操作，仍以用户通过前端界面交互、对单笔交易进行签名确认为核心模式。这种以用户界面为中心的模式伴随普通用户的普及实现了规模化应用，即便链上相当一部分活动已由机器驱动。当前主流的普通用户交互逻辑依旧是：操作意图→用户界面→发起交易→确认完成。程序化操作虽路径不同，却也存在自身限制：开发者需在构建阶段选定合约与资产范围，再基于该固定范围运行算法。这两种模式均无法适配需要在运行过程中，根据动态目标自主发掘、评估并组合操作行为的系统。

当专为交易验证优化的基础设施，被需要同时解读经济状态、评估信用并围绕明确目标优化行为的系统使用时，运行阻碍便开始显现。这类差距一部分源于区块链无许可、异构化的设计特性，另一部分则源于现有工具仍围绕人工审核与前端中介来封装区块链交互流程。

智能体操作流程与传统算法策略

在分析区块链基础设施与智能体系统的差距之前，有必要明确更高级的智能体操作流程，与传统链上算法系统的核心差异。

二者的区别并非自动化程度、技术复杂度、参数化设置，甚至也不是动态适配能力。传统算法系统可实现高度参数化，自动发掘新合约与代币，在多类策略间配置资金，并根据表现进行再平衡。核心差异在于系统能否处理构建阶段未被预设的场景。

传统算法系统无论多么复杂，都仅能针对研发阶段预设的模式执行既定逻辑。这类系统需要为每类协议配置预设的接口解析器、将合约状态转化为经济含义的预设评估逻辑、明确的信用与标准判定规则，且所有决策分支都需编写硬编码规则（无论算法本身多动态、多灵活）。一旦出现不符合预设模式的情况，系统要么跳过该场景，要么直接运行失效。它无法对陌生场景进行推理判断，仅能校验当前场景是否匹配已知模板。

像这只“消化鸭”这样的机械自动装置可以模仿逼真的行为，但每一个动作都是预先设定好的。（《科学美国人》，1899年1月）

传统算法在扫描新借贷市场时，能够识别出发出熟悉事件、或匹配已知工厂模式的部署合约。但如果出现一种接口陌生的新型借贷基础组件，系统便无法对其进行评估。必须由人工检查合约、理解其运行机制、判断其是否纳入机会池，并编写集成逻辑。只有完成这些步骤，算法才能与之交互。人类负责解读，算法负责执行。而基于基础模型的智能体系统打破了这一界限。它们可以通过习得的推理能力实现：

解读模糊或未明确指定的目标。像 “最大化收益但避免过度风险” 这类指令需要解读：什么程度算过度？收益与风险应如何权衡？传统算法需要提前对这些条件做出精确定义，而基础模型能够解读意图、做出判断，并根据反馈优化自身理解。
泛化适配新型接口。智能体可以阅读陌生的合约代码、解析文档，或检查从未见过的应用二进制接口（ABI），并推断该系统的经济功能。它不需要为每一类协议预先构建解析器。目前这一能力尚不完善，智能体可能出现误判，但它能够尝试与开发阶段未被预设的系统进行交互。
在不确定性下对可信度与规范性进行推理。当信任信号模糊或不完整时，基础模型可以概率化地权衡判断，而非简单套用二元规则。该智能合约是否为官方正版？现有证据下该代币是否大概率合法？传统算法只有 “有规则” 或 “无规则” 两种状态，而智能体能够基于置信度进行推理。
解读错误并自适应调整。当出现意外情况时（例如交易回退、输出与预期不符、模拟与执行间状态发生变化），智能体能够推断问题原因并决定应对方式。相比之下，传统算法只会执行异常捕获代码块，仅对异常进行分流处理，而非解读异常。

这些能力真实存在，但目前仍不完善。基础模型会产生幻觉、误读信息，并做出看似自信的错误判断。在对抗性且涉及资金的环境中（即代码可控制或接收资产），“尝试与未预设系统交互” 可能意味着直接亏损。本文的核心观点并非智能体如今就能可靠地完成这些功能，而是它们能够以传统系统无法实现的方式进行尝试，且未来基础设施有望让这些尝试更安全、更可靠。将二者视作连续谱系而非绝对分类会更易理解：部分传统系统已融入学习式推理，部分智能体也可能在关键路径上依赖硬编码规则。二者的区别是方向性的，而非二元对立的。智能体系统将更多解读、评估与自适应工作放到运行时推理中，而非开发阶段预设。这与前文的阻碍论点密切相关，因为智能体尝试去做的正是传统算法完全回避的事。传统算法通过人工在开发阶段筛选合约集合来规避发现成本；依靠运营者维护的白名单规避控制层成本；通过为已知协议预置解析器规避数据成本；在预设安全范围内运行规避执行成本。人工提前完成语义、信任与策略层面的工作，算法仅在划定边界内执行。链上智能体操作流程的早期版本可能会延续这一模式，但其核心逻辑在于将发现、信任与策略评估转移到运行时推理，而非开发阶段预设。

智能体可能会尝试发现并评估陌生机会，在无硬编码规则的情况下判断合约规范性，在无预置解析器的情况下解析异构状态，并针对可能模糊的目标执行策略。而正是在这些环节，基础设施的短板开始凸显。阻碍之所以存在，并非因为智能体在做和算法相同的事却更困难，而是它们在尝试完全不同的事：在开放、动态解读的行为空间中运行，而非封闭、预先集成的固定空间。

摩擦所在

从结构上看，这种矛盾并非源于区块链共识的缺陷，而是围绕其构建的整体交互栈的演进方式所致。

区块链保证确定性状态转换、对最终状态的共识以及最终确定性。但它不会在协议层编码经济解读、意图校验或目标追踪。这些职责历来由前端、钱包、索引器及其他链下协同层承担，且流程中始终有人工参与。

主流交互模式也反映了这一设计，即便是专业参与者也是如此：普通用户通过面板解读状态、通过界面选择操作、通过钱包签名交易，并非正式地验证结果；算法交易机构实现了执行自动化，但仍依赖人工筛选协议集合、核查异常情况，并在接口变更时更新集成逻辑。两种场景下，协议仅保证执行正确性，而意图解读、异常处理与新机会适配仍由人工完成。

智能体系统压缩甚至消除了这一分工。它们必须以程序化方式重构具备经济意义的状态，评估目标是否推进，并在简单交易上链之外校验结果。这些负担在区块链上尤为突出，因为智能体运行在开放、对抗性且快速变化的环境中，新合约、资产与执行路径可在无中心化审核的情况下出现。协议只保证交易正确执行，不保证经济状态易于解读、合约为官方正版、执行路径符合用户意图，或相关机会可被程序化发现。

后续章节将围绕智能体运行循环的各个阶段分析此类阻碍：发现现有合约与机会、验证其合法性、获取具备经济意义的状态，以及按目标执行。

发现成本

发现成本的产生，是因为去中心化金融（DeFi）行为空间在开放无许可环境中持续扩张，而相关性与合法性需由人工通过链上社交、市场与工具层进行筛选。新协议通过公告与研究发布，同时也经由前端集成、代币列表、分析平台与流动性形成等筛选层过滤。久而久之，这些信号通常会形成一套可操作的判断标准，用以识别行为空间中具备经济价值且足够可信的部分，尽管这一过程往往是非正式、不均衡的，且部分依赖第三方与人工筛选。

智能体虽可获取筛选后的数据与信任信号，但并不具备人类解读这些信号时的天然捷径。从链上视角看，所有已部署合约的可发现性是平等的。合法协议、恶意分叉、测试部署与废弃项目，全都以可调用字节码的形式存在。链上不会标记哪些重要、哪些安全。

从链上视角来看，所有已部署的合约都具有同等的可发现性。合法协议、恶意分叉合约、测试部署合约以及废弃项目，全都以可调用字节码的形式呈现。

因此，智能体必须自行构建发现机制：扫描部署事件、识别接口模式、追踪工厂合约（程序化部署其他合约的合约），并监控流动性形成，以判断哪些合约应纳入决策范围。这一过程不仅是寻找合约，更是判断其是否值得进入智能体的行为空间。

识别候选合约只是第一步。合约通过初步发现筛选后，还需经过下一节所述的规范性与真实性验证。智能体必须确认所发现合约与其宣称一致，才能将其纳入决策空间。

策略限定型发现不同于开放式发现

发现成本并非指检测新部署。成熟的算法系统已能在自身策略范围内实现这一点。例如监控 Uniswap 工厂事件并自动纳入新流动性池的搜索者，就是在执行动态发现。阻碍出现在两个更高层面：判断所发现合约是否合法（下一节将讨论的规范性问题）；判断其是否服务于开放式目标，而非仅适配预设策略类型。

搜索者的发现逻辑与其策略紧密绑定，它知道要寻找何种接口模式，因为策略已预先定义。而承担 “配置最优风险调整后机会” 这类更广泛任务的智能体，不能仅依赖策略衍生过滤器。它必须对照目标本身评估新遇到的机会，这需要解析陌生接口、推断经济功能，并判断该机会是否应纳入决策空间。这部分属于通用自主性问题，但区块链加剧了这一难度：陌生代码可直接执行、承载资金，且仅靠协议原生信号难以分类。

控制层摩擦

控制层成本的产生，是因为身份与合法性通常在协议外部通过筛选、治理、文档、接口与运营者判断共同确定。在当前多数工作流程中，人工仍是该判定过程的重要环节。区块链保证确定性执行与最终确定性，但不保证调用者正在与目标合约交互。意图判定被外包给社交语境、网站与人工筛选。

当前流程中，人类将网页信任层作为非正式验证工具：通过 DeFiLlama 等聚合平台或项目认证社交账号找到官方域名，并将该网站视为人工概念与合约地址间的官方映射。前端随后会编码一套有效真值源，标明哪些地址为官方、使用哪种代币表示、哪些入口安全。

1789年的机械土耳其人（Mechanical Turk）是一款下棋机器，表面上看起来自主运行，但实际上依靠一名隐藏的人工操作员。（洪堡大学图书馆）

智能体默认不会通过社交语境来解读品牌标识、已认证的社交信号或 “官方性”。我们可以为智能体提供源自这些信号的筛选后输入，但要将其转化为稳定可用、机器可执行的信任假设，则需要明确的注册表、策略规则或验证逻辑。运营者可以为智能体配置精选白名单、认证地址和信任策略。问题不在于社交语境完全无法获取，而在于在动态扩张的行为空间中持续维护这些防护屏障会带来巨大的运营负担，并且当这些屏障缺失或不完善时，智能体缺乏人类下意识使用的备用验证机制。

这种信任判定能力不足所带来的实际后果，已经在链上智能体驱动系统中显现。YouTube 加密博主兼网红 Orangie 就曾发生过智能体将资金存入蜜罐合约的案例。另一起事件中，名为 Lobstar Wilde 的智能体因状态或上下文故障，错误解读了地址状态，将大额代币余额转给了线上 “乞讨地址”。这些案例并非本文的核心论据，但它们直观说明了信任判定、状态解读与执行策略上的失误，会直接导致资金损失。

官方合约识别并非协议原生功能

问题不在于合约难以被发现，而在于链上通常不存在原生的 “这是某应用 X 的官方合约” 这一概念。这种缺失一定程度上是无许可系统的特性，而非设计疏漏，但它依然给自主系统带来了协同难题。该问题部分源于弱规范身份的开放系统架构特性，部分则源于注册表、标准和信任分发机制尚不成熟。若一个智能体想要与 Aave v3 交互，就必须判定哪些地址是官方正版（资金池、配置器、数据提供方等），以及这些地址是不可变合约、可代理升级合约，还是正处于治理提案变更待执行状态。

人类通过文档、前端界面和社交媒体解决这一问题，而智能体则必须通过核查以下信息来判定：

代理模式与实现合约指向
管理权限与时间锁合约
受治理控制的参数更新模块
已知部署合约间的字节码 / 应用二进制接口（ABI）匹配度

在缺乏官方注册表的情况下，“官方性” 就变成了一个推理问题。这意味着智能体不能将合约地址视为静态配置。它们要么持续维护经过验证的精选白名单，要么在运行时通过代理核查与治理监控重新推导合约规范性，要么承担与废弃、被攻击或伪造合约交互的风险。在传统软件与市场基础设施中，服务身份通常由机构维护的命名空间、凭证和访问控制来锚定。相比之下，在链上，一个合约可能可以调用、功能正常，但从调用方视角来看，其在经济或业务层面并非官方正版。

代币真实性与元数据问题本质相同

代币看似会自我描述信息，但其元数据并不具备权威性，仅仅是合约代码返回的字节数据。典型案例就是封装以太坊（WETH）。广泛使用的 WETH 合约中明确定义了：

这些信息看似代表身份，实则不然。任何合约都可以返回如下内容：

symbol() = "WETH"
decimals() = 18
name() = "Wrapped Ether"

并实现完全相同的 ERC-20 代币标准接口。name()、symbol() 和 decimals() 只是公开只读函数，返回的内容完全由部署者设定。事实上，以太坊上已有近 200 种代币，名称都叫 “Wrapped Ether”，符号都是 “WETH”，精度也都是 18 位小数。如果不查 CoinGecko 或 Etherscan，你能分辨出哪个 “WETH” 才是官方正版吗？（答案是列表里的第 78 个）

以太坊上有近200个代币名称为“Wrapped Ether”、符号为“WETH”。不借助第三方平台，你能判断哪个才是正宗的WETH吗？

这就是智能体面临的处境。区块链不会校验唯一性，不会对照任何注册表做验证，也对此毫不在意。你今天就可以部署 500 个合约，全部返回一模一样的元数据。链上也存在一些经验式判断方法（例如比对 ETH 余额与总供应量、查询主流去中心化交易所的流动性深度、核查其是否被借贷协议列为抵押品等），但没有任何一种能提供绝对确凿的证明。每种方法要么依赖阈值假设（没人能伪造数十亿规模的配对流动性），要么递归式地需要先验证其他合约的规范性。

如同迷宫一般，在链上识别“真正”的路径需要外部引导；没有提供任何标准信号。（伯明翰博物馆和美术馆）

这就是代币列表与注册表作为链下筛选层存在的原因。它们提供了一种将 “WETH” 这一概念映射到特定地址的机制，这也是钱包和前端会维护白名单或依赖可信聚合器的原因。对智能体而言，核心问题不只是元数据不可靠，更在于规范身份通常由社交或机构层面确立，而非协议原生。链上可靠的唯一标识符是合约地址，然而要将人类易懂的意图（如 “兑换为 USDC”）映射到正确地址，仍高度依赖非协议原生的筛选、注册表、白名单或其他信任层。

数据摩擦

一个在多个 DeFi 协议间做优化的智能体，需要将每个机会统一抽象为经济对象：收益率、流动性深度、风险参数、费率结构、预言机来源等。从某种角度看，这是常见的系统集成问题。但在区块链上，由于协议异构性、直接资金风险、多调用状态拼接、底层缺乏统一经济 schema，这一负担被大幅放大。而这些正是对比机会、模拟配置、监控风险所必需的基础信息。

区块链在协议层通常不暴露标准化的经济对象，只暴露存储槽、事件日志和函数返回值，经济对象必须从中推导或重构。协议只保证合约调用返回正确的状态值，却不保证该值能清晰对应到可理解的经济概念，也不保证同一概念能在不同协议间通过一致接口获取。

因此，市场、头寸、健康系数等抽象概念并非协议原生组件，而是由索引器、分析平台、前端与 API 在链下重构，将异构协议状态归一化为可用的抽象层。人类用户通常只看到这层归一化后的数据，智能体也可以使用，但会因此继承第三方 schema、延迟与信任假设；否则就必须自行重构这些抽象逻辑。

这一问题在各类协议中进一步加剧。金库份额价格、借贷市场抵押率、DEX 池流动性深度、质押合约奖励率等都是具备经济意义的基础指标，但没有一个通过标准化接口暴露。每个协议体系都有自己的读取方式、结构体格式与单位约定，即便同一类别，实现方式也各不相同。

借贷市场：读取碎片化的典型案例

借贷市场能清晰体现这一问题。经济概念普遍相似且通用，例如供给与借贷流动性、利率、抵押系数、额度上限、清算阈值等，但数据读取路径却完全不同。

以 Aave v3 为例，市场枚举与储备资产状态读取是分开的步骤，典型流程如下：

通过以下方式列举储备资产

该函数会返回一个代币地址数组。

针对每种资产，通过以下方式获取流动性与利率基础数据：

该调用会返回一个结构体，单次即可获取包含流动性总量、利率指数和配置标识在内的数据，例如：

与之相反，在 Compound v3（Comet）中，每一次部署只对应单一市场（如 USDC、USDT、ETH 等），并且不存在统一的储备金结构体。因此，必须通过多次函数调用，才能拼接出完整的市场快照数据：

基础利用率

总计

利率

抵押资产配置

全局配置参数

每次调用仅返回经济状态的不同片段。“市场” 并非一等公民对象，而是由调用方自行拼接而成的推断性结构。

从智能体的角度来看，这两个协议都属于借贷市场。但从集成角度来看，二者是结构完全不同的数据获取系统。并不存在像下面这样的通用数据结构：

相反，智能体必须针对不同协议采用不同的资产枚举方式，通过多次调用拼接状态数据，统一计量单位与换算规则，并协调推导值与直接暴露的基础数据之间的差异。

碎片化带来延迟与一致性风险

除了结构上的不统一，这种碎片化还会引发延迟与一致性风险。由于经济状态并非以单一原子化市场对象暴露，智能体必须向多个合约发起多次远程过程调用（RPC），才能重构出一份状态快照。每多一次调用，都会增加延迟、触发接口限流的概率以及区块不一致的风险。在市场波动环境中，当供给利率计算完成时，资金利用率可能已发生变化；若不明确锁定区块高度，配置参数与流动性总量可能并非来自同一区块。人类用户依靠前端缓存层与聚合后端隐式缓解了这一问题，而直接调用原始 RPC 接口的智能体，则必须显式处理数据同步、批量请求与时间一致性问题。因此，非标准化的数据获取不仅是集成上的不便，更是对性能、同步机制与执行正确性的约束。

缺乏统一的经济数据获取规范意味着，即便不同协议实现了几乎相同的金融基础功能，其状态暴露方式也依然是合约专属、且依赖组合逻辑的。这种结构差异是造成数据摩擦的核心原因。

潜在的数据流不匹配

区块链上的经济状态访问本质上是拉取模式，即便执行信号可以流式推送。外部系统需要向节点主动查询所需状态，而非接收持续、结构化的更新。这一模式反映了区块链的核心功能 —— 按需验证，而非维护应用级别的持续状态视图。

链上也存在推送模式的基础组件。WebSocket 订阅可实时推送新区块与事件日志，但这些并不包含承载大部分经济含义的存储状态，除非协议主动选择冗余地将其记录为日志。智能体无法直接通过链上订阅借贷市场利用率、资金池储备量或头寸健康系数。这些数值存储在合约存储空间中，且大多数协议不提供原生机制，向下游使用者推送存储变更。当前最可行的方式是订阅新区块头，并在每个区块重新查询存储状态 —— 即便由流式事件触发，状态访问本质上仍为拉取模式。日志仅能提示数据可能发生变化，却不会编码最终的经济状态；重构该状态仍需显式读取并访问历史状态。

智能体系统反而更适合反向数据流。智能体无需轮询数百个合约的状态变化，而是可以接收结构化、预计算的状态更新，并直接推送至其运行环境（例如更新后的利用率、健康系数或头寸变动）。推送式架构可减少冗余查询，降低状态变化到智能体感知的延迟，并允许中间层将状态封装为语义明确的更新，而非让智能体从原始存储中自行解读含义。

这种模式转变并非易事。它需要订阅基础设施、筛选相关性的逻辑，以及将存储变动转化为智能体可执行操作的经济事件规范。但随着智能体成为持续在线的参与者，而非间歇性查询方，拉取模式的低效问题 —— 接口限流、同步开销、不同智能体间的重复查询 —— 将变得愈发严重。将智能体视为持续消费者而非间歇性客户端的基础设施，或许更适配自主系统的运行方式。

推送式基础设施是否真的更优，尚无定论。全量状态变化的数据流会带来筛选问题，智能体仍需判断哪些信息相关，这会在另一层面重新引入拉取逻辑。核心并非拉取模式本身错误，而是现有架构在设计时并未考虑持久化机器使用者，随着智能体使用规模扩大，值得探索替代方案。

执行摩擦

执行摩擦的产生，是因为当前许多交互层将意图转换、交易审核与结果校验，封装在以前端、钱包和人工监管为核心的工作流程中。在普通用户与主观决策场景下，这一监管通常由人类完成。而对自主系统而言，这些功能必须被形式化并直接编码实现。区块链可根据合约逻辑保证确定性执行，却不保证交易符合用户意图、遵守风险约束或实现预期经济结果。在现有流程中，前端界面与人类填补了这一缺口。

前端编排操作序列（兑换、授权、存入、借贷），钱包提供最终 “审核并发送” 的检查点，用户或操作者通常会在最后一步非正式地做出策略判断。他们往往在信息不完整的情况下，判断交易是否安全、报价结果是否可接受。若交易失败或出现意外结果，用户会重试、调整滑点、更改路径或直接放弃操作。智能体系统将人类从这一执行循环中移除，意味着系统必须用机器原生逻辑替代三类人类功能：

意图编译。类似 “将我的稳定币配置到风险调整后最优收益渠道” 的人类目标，必须编译为具体行动计划：选择哪个协议、哪个市场、哪条代币路径、操作规模、授权方式及执行顺序。对人类而言，这一过程通过前端隐式完成；对智能体则必须形式化实现。
策略执行。点击 “发送交易” 不仅是签名行为，更是隐式校验交易是否符合约束：滑点容忍度、杠杆上限、最低健康系数、白名单合约或 “禁止可升级合约” 等。智能体需要将显式策略约束编码为机器可校验规则：

执行系统必须在广播交易前，验证拟执行的调用关系图符合这些规则。

结果校验。交易上链并不等于任务完成。一笔交易即便执行成功，也可能未达成目标：滑点可能超出容忍范围、因额度限制未能达到目标头寸规模，或利率在模拟与上链之间发生变动。人类会在交易后通过前端界面进行非正式校验，而智能体则必须以程序化方式评估执行后的状态条件：

这就对完成度校验提出了更高要求，不能仅停留在确认交易上链。以意图为中心的架构或许能提供部分解决方案，将更多关于 “如何执行” 的负担从智能体转移给专业的求解器。智能体不再发送原始调用数据，而是广播已签名的执行意图，并指定基于结果的约束条件；求解器或协议层机制必须满足这些约束，执行才被视为有效。

多步骤工作流与故障模式

去中心化金融（DeFi）的很大一部分执行过程天然是多步骤的。一笔收益配置操作可能需要依次完成：授权 → 兑换 → 存入 → 借贷 → 质押。其中部分步骤可能是独立交易，另一些则可通过批量调用或路由合约打包执行。人类可以容忍流程未完全完成，返回界面继续操作即可；而智能体需要确定性的流程编排：若任意一步失败，必须决定是重试、更换路径、回滚操作还是暂停执行。

这催生了在人类操作流程中通常被掩盖的新型故障模式：

决策与上链之间的状态漂移：模拟执行与实际上链期间，利率、利用率或流动性可能发生变化。人类可以接受这种波动，智能体则必须设定可接受范围并严格执行。
非原子执行与部分成交：部分操作可能跨多笔交易执行，或仅产生部分预期结果。智能体必须追踪中间状态，并确认最终状态符合目标。
授权额度与审批风险：人类通过界面习惯性完成授权签名，智能体则必须将授权范围（额度、支出方、有效期）纳入安全策略进行推理，而非仅作为界面步骤处理。
路径选择与隐性执行成本：人类依赖路由工具与界面默认配置，智能体则必须将滑点、矿工可提取价值（MEV）风险、Gas 费与价格冲击纳入目标函数建模。

执行：一个机器原生的控制问题

执行摩擦的核心观点在于：DeFi 交互层将人类钱包签名作为最终控制环节。当前，意图校验、风险容忍度判断以及非正式的 “看起来是否合理” 检查，都集中在这一步完成。移除人类参与后，执行就变成了一个控制问题：智能体必须将目标转化为操作链，自动执行策略约束，并在不确定性中校验结果。这一挑战在许多自主系统中都存在，但区块链环境尤为严苛，因为执行直接涉及资金，可组合调用陌生合约，且面临对抗性的状态变更。人类依靠经验做出决策，并通过试错纠正错误；智能体则必须以机器速度程序化完成同类工作，且往往面对动态变化的操作空间。因此，认为智能体 “只需提交交易” 的观点，大大低估了难度。提交交易本身是简单的部分，真正缺失的是界面与人类所承担的全部工作：意图编译、安全把关与目标完成度校验。

结论

区块链在设计之初并未原生提供自主智能体所需的语义层与协同层。它的设计目标是在对抗环境中保证确定性执行与状态转换共识。在此基础上发展出的交互层，始终围绕人类用户展开：通过界面解读状态、通过前端选择操作、通过人工核查验证结果。

智能体系统颠覆了这一架构。它们将人类解读员、审批员与核验员从流程中移除，并要求这些功能实现机器原生化。这一转变在四个维度暴露出结构性摩擦：发现、信任判定、数据获取与执行编排。这些摩擦的产生，并非因为执行不可行，而是因为区块链周边的基础设施在多数场景下仍默认人类参与状态解读与交易提交之间的环节。

弥合这些缺口可能需要在多层技术栈中搭建新型基础设施：将跨协议经济状态归一化为机器可读规范的中间件；暴露头寸、健康系数、机会集合等语义基础组件而非原始存储数据的索引服务或 RPC 扩展；提供官方合约映射与代币真实性验证的注册表；以及可编码策略约束、处理多步骤工作流并程序化校验目标完成度的执行框架。部分缺口源于无许可系统的结构性特征：开放部署、弱规范身份与异构接口；另一部分则受限于现有工具、标准与激励设计，随着智能体使用规模扩大、协议为提升自主系统集成便利性而竞争优化，这些问题有望得到缓解。

随着自主系统开始管理资金、执行策略并直接与链上应用交互，当前交互层内嵌的架构假设愈发凸显。本文所述的大部分摩擦，源于区块链工具与交互模式围绕人工中介工作流发展而来；部分则是无许可系统的开放性、异构性与对抗环境的自然结果；还有一些是复杂环境下自主系统普遍面临的共性问题。

核心挑战并非让智能体完成交易签名，而是为其提供可靠路径，实现当前在原始区块链状态与实际操作之间，由软件与人类判断共同完成的语义、信任与策略相关功能。