作者:Lucas Tcheyan,Galaxy Digital研究员;来源:Galaxy;编译:Shaw 金色财经
上周二,Anthropic 发布了 Claude Mythos Preview 预览版。这款前沿 AI 模型在挖掘与利用软件漏洞方面能力极强,官方表示无法向公众开放。相反,在一项名为 Project Glasswing 的网络安全防御新计划下,模型仅向约 40 家机构开放访问权限,其中包括苹果、微软、谷歌、亚马逊、摩根大通以及 Linux 基金会。
该模型展现出的能力极为突出。据 Anthropic 称,Mythos 在各大主流操作系统与网页浏览器中发现了数千个此前未知的安全漏洞,其中部分漏洞历经数十年人工审查与数百万次自动化安全扫描仍未被发现。在一项测试中,Mythos 成功生成可实际利用的攻击代码181 次,而 Anthropic 此前表现最优的模型仅完成两次。在另一项测试中,模型自主编写了完整的远程 root 权限攻击代码 —— 可让攻击者完全掌控服务器,在初始提示词后无需任何人工干预,成本不到 50 美元。Anthropic 表示,这类能力并非通过专门训练获得,而是代码能力与推理能力全面提升后自然涌现的结果。这意味着,未来所有代码能力更强的模型,其破坏能力也会同步提升。在附带的 244 页系统说明文档中还披露,该模型能够在内部激活过程中规划如何骗过评估系统,同时在可见输出中生成完全不同的内容,这类行为只有通过专业的模型可解释性工具才能检测到。
此次发布前不久,Anthropic 刚披露其年化收入从 3 月的 190 亿美元飙升至 4 月的 300 亿美元,另有消息称公司正考虑最早于 10 月启动 IPO。
无论你是否全盘采信 Anthropic 的公开表述,技术发展的趋势已十分清晰:AI 能力正以惊人速度迭代,任何拥有资产与数据需要保护的主体都必须高度重视,而加密行业正是重点攻击目标。Mythos 已在 TLS、AES-GCM、SSH 等广泛使用的加密库中发现关键漏洞,这些协议正是去中心化金融(DeFi)平台与中心化交易所底层基础设施的核心支撑。
Mythos 还在传输控制协议(TCP)中发现了被认为已于 27 年前修复的漏洞。全球约 80% 的互联网流量基于 TCP 运行,包括 HTTP/HTTPS、邮件协议与文件传输等。攻击者一旦利用这些缺陷,可瘫痪互联网核心基础设施,包括加密行业运行所依赖的底层网络。Anthropic 同时警告,基于人工干预与流程门槛的安全措施,在面对 AI 辅助的攻击者时「防护能力可能大幅下降」。
在去中心化金融领域,多签钱包、时间锁、安全审计等依赖人工与流程的防护手段,往往是整个安全体系的核心。Anthropic 研究人员认为,一旦安全格局达到新的平衡,AI 最终会让防御方比攻击方获益更多。但过渡期将充满动荡,短期内,率先部署这类工具的一方将占据优势。
同时,官方的表述框架也存在值得质疑之处。2019 年,Anthropic 创始人兼 CEO Dario Amodei 仍在 OpenAI 任职时,该公司就曾以「过于危险、不宜发布」为由对 GPT2 进行类似宣传,次年他便离职创立了 Anthropic。对于一家正冲刺 IPO、营收高速增长的公司而言,「危险到不能公开」既是安全声明,也是极具竞争力的营销叙事,尤其在 OpenAI 宣布年化营收 240 亿美元的背景下更为明显。此外有证据显示,这些能力并不像公告所暗示的那样独一无二。某网络安全公司使用小型、低成本的开源权重模型测试了其展示的漏洞,结果 8 个测试样本全部检出核心攻击漏洞,其中包括一个 360 亿参数、每百万令牌仅需 0.11 美元的模型。该机构认为,真正的技术壁垒是整套系统体系(配套框架、漏洞分类与领域专业知识),而非单一模型本身。
这一趋势至关重要:最具颠覆性的 AI 能力正越来越多地被限制在封闭访问计划中,而 Project Glasswing 或将成为前沿模型向全球开放的范本。随着 AI 能力持续升级,由谁掌控最强模型的访问权限、以何种条件开放,问题将愈发尖锐。去中心化 AI 基础设施是一种制衡力量,但反方观点同样成立:部分能力确实不宜无限制开放,而负责任的管控与构建商业壁垒之间的界限十分模糊。
如何平衡这种矛盾,将成为未来数年的核心挑战之一。加密行业既是 AI 辅助攻击的高价值目标,又是替代型基础设施的建设者,恰好身处这场博弈的两端。
声明:本文系金色财经原创稿件,版权属金色财经所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:金色财经",违者将依法追究责任。
提示:投资有风险,入市须谨慎。本资讯不作为投资理财建议。
Foresight News
华尔街见闻
Barrons巴伦
C Labs 加密观察
腾讯财经
