作者:孙骋;来源:Barrons巴伦
4月的美股沉浸在一场由AI主导的结构性狂欢之中,纳指单月暴涨15.3%,标普500上涨10.4%,费城半导体指数更是创下2000年以来最大单月涨幅。5月之后,市场的剧本便迅速翻篇,美股三大指数高位震荡,表面的平静之下,暗流汹涌:ARM凭借财报利好股价单周狂飙42.58%,闪迪、希捷等存储龙头单周涨幅均超15%,而曾经的AI“旗手”英伟达、微软股价下跌。
这是AI主线的熄火,还是一场深刻的内部切换?资金正在从GPU和云巨头流向ARM架构与存储芯片,市场似乎在交易“训练算力见顶、端侧推理与存储接棒”的新逻辑。道指创出新高,是否意味着风格轮动已然开启?ARM的暴涨是价值重估的起点,还是短期泡沫的顶点?
1、AI热潮未结束,但进入精细化分化阶段:资金仍在持续流入AI领域,但已从普涨转向选择性下注。市场内部从GPU和云巨头流向ARM架构与存储芯片,交易逻辑切换为“训练算力见顶、端侧推理与存储接棒”。
2、资金抱团效应强劲,只是抱团对象切换:量化交易、末日期权和杠杆ETF改变了市场生态,做市商对冲行为加剧助涨助跌。抱团效应并未消退,而是从英伟达等标的转移至ARM、闪迪等新热点,导致“涨到颠覆三观”。
3、ARM暴涨属典型逼空行情,不可持续:伽马挤压与空头挤压相互叠加,导致股价短期狂飙。这种走势无法永远持续,一旦买盘耗尽或情绪动摇,股价可能快速掉头向下,需格外小心。
4、ARM架构在端侧推理具备本质优势:作为RISC精简指令集,ARM能效比x86低近一半;IP授权模式支持定制化异构设计;矩阵运算优化更适配Transformer模型。产业长期拐点已形成,但短期股价波动剧烈。 5、英伟达训练端地位稳固,推理端面临挑战:CUDA生态护城河难以逾越,训练端无实质挑战者。但在推理端,AMD及谷歌、微软等自研芯片因“天下苦英伟达久矣”获得倾斜机会,未来英伟达份额将降低但仍是主力。 6、推理算力负载已超训练,未来占比达七至八成:目前推理与训练算力负载约6:4,但资本支出仍训练占六成。随着大模型普及和Agentic AI发展,加上训练迭代放缓,推理端对成本、功耗、延迟的严苛要求为ARM、存储芯片带来新机遇。
孙骋:AI主导的上涨潮结束了吗?资金从GPU/云巨头流向ARM和存储,背后的核心驱动力是什么?
猫姐:从2023年开始,美股就已经开始对AI进行重点关注。整个2023年最明星的个股就是英伟达,它属于半导体,但主要驱动力就是AI。这一波行情从那时起一直持续到2024年、2025年,到现在已经是分层次、节奏地全面开花的状态。所以,AI热潮现在说它结束还为时过早。
从我们最新监控的上周五美股数据来看,进入AI领域的资金仍然没有出现任何衰减的迹象。但这里面有一个显著特点,就是“分化中的分化”。我们看到整个美股大盘从去年10月份开始就进入了滞涨状态,10月到2月一直在横盘。在大盘横盘的过程中,一些软件股以及受AI冲击的部分大科技股,实际上已经出现了衰竭和回调。但同样是大盘横盘甚至下跌的这段时间,一些AI的热门板块,比如存储和光通信,这些板块不但没跌,反而是上涨的,这就体现了市场分化和资金重点方向。
所以,未来从资金监控来看,无论是新买家还是存量买入方,都依然非常积极。但市场呈现出一个持续的态势,就是在AI这个大板块内部,资金不断去寻找热点、寻找分化、寻找新的题材和不同赛道的公司。因此,上涨潮并未结束,而是进入了一个更加精细化的阶段。
孙骋:纳指、标普500创近六年最佳月度表现,费城半导体指数创2000年以来最大单月涨幅。这种极端行情背后,除了AI驱动,市场情绪修复和资金抱团效应具体体现在哪些方面?5月中旬后市场并未继续普涨,是否意味着市场情绪从“整体乐观”转向“选择性下注”?抱团效应是否依然存在?
猫姐:这可以从两个方面来看。一方面是美股典型的技术性行情。通常来说,在长时间横盘和下跌之后,美股会迎来一轮报复性上涨,比如2020年的行情,以及2023年8月到10月底3个月的回调后迎来的近半年暴涨。从去年10月份开始,美股大盘陷入了停滞状态,重心点位在几个月内都没有变化,这是典型的蓄势整理。3月份的最后一跌是一次严重的估值回调,3月30号成为这轮底部。因此,4月份开始的暴涨,本质上是对之前近半年横盘的一种修复。美股的显著特点是“stay in the game”,你必须留在游戏里,因为反弹可能就在一两天内完成。统计显示,无论过去50年、30年还是10年,如果错过了全年中的这几个单日或几日反弹和暴涨的行情,全年的收益对比下来是差距很大的。
另一方面,资金抱团效应依然存在,但现在的市场与以前完全不同。量化交易、机器程序交易、散户的大量参与以及海量的期权和杠杆ETF,使得市场生态发生了根本性变化。做市商为了对冲风险,不得不采取一些行为,这些行为会加剧市场的助涨和助跌。特别是在AI头部热点个股上,所有散户都在做末日期权,而大户(资金体量大、对市场有影响的玩家)也在追逐这些热点。这造成了加速的助涨和助跌,导致近年来美股抱团效应越来越强,“涨到颠覆三观”的现象越来越多。因此,市场并非从乐观转向悲观,而是抱团的对象发生了变化,资金仍在集中,只是切换了标的。
孙骋:ARM单周涨幅超42%,两个交易日即完成如此巨大的涨幅。这在技术上是否已属于“逼空”行情?是否存在散户情绪或期权伽马挤压的助推?这种速度的上涨可持续吗?
猫姐:这确实是非常典型的逼空行情,其中伽马挤压效应起到了重要作用。现在的美股市场,一旦出现热点,所有机构、大户、散户都在追。大量末日期权的存在,会造成伽马挤压问题。做市商中,很多并不赌方向,而是靠做买卖赚取差价。当市场上大多数玩家都买入末日期权或近期价外看涨期权时,做市商面临巨大风险:一旦股票上涨,他们需要兑现期权,为了对冲风险(保持delta中性),他们不得不持续买入大量正股。买入的人越多,做市商需要买入的正股就越多,股价因此被疯狂推高。我们最近看到的许多美股尾盘30分钟效应,很多就是由这种挤压效应造成的。回过头来,看到股价一再被推高,兴奋的投资者又会继续加大仓位买入看涨期权,这继续倒逼做市商买入正股对冲。
此外还有空头挤压。一些投资者认为股价明显背离估值而选择做空,但由于上述机制导致股价继续上涨,空头最终被迫爆仓平仓、买入股票,形成空头相互碾压。在ARM这只股票上,如果这种走势持续时间更长、曲线更陡峭,就会成为逼空的典型。
关于可持续性,这种行情从技术上讲是无法永远持续下去的。一旦所有空头都缴械了,或者新买家信心稍微被股价波动所动摇,市场失去争议和缓冲垫,股价就容易在获利盘回吐或市场情绪稍有犹豫时快速掉头向下,而且和上涨一样也有迭加效应。因此,这种行情要格外小心。
孙骋:ARM上周暴涨42.58%,市场核心交易逻辑是“AI从训练转向端侧推理,ARM架构将大幅受益”。请您从技术角度分析:ARM的指令集和授权模式在AI推理场景中相比x86有哪些本质优势?这一轮价值重估是短期财报催化,还是产业长期拐点?
王淮:从技术层面看,市场现在转向以端侧推理为主的AI算力应用,这个大逻辑是比较明显的。ARM比x86更适合端侧的核心原因有三点:
第一,指令集优势。ARM是RISC(精简指令集),x86是CISC(复杂指令集)。RISC不需要将流水线设计得过于复杂,因此相同芯片面积下可以集成更多核心、缓存或专用加速单元,有利于近内存计算。在AI推理中,一个重大瓶颈就是内存通信。ARM具有灵活的物理IP和定制化能力,天然适合AI推理运算。在典型端侧负载下,ARM架构能效显著优于x86,功耗通常可低近一半,带来巨大的成本优势。
第二,授权模式优势。ARM是IP授权模式,客户可以在拿到授权后做定制化设计,比如将CPU与GPU、NPU如何配合,可以自由操作。而x86是一个“黑盒子”,很难在其基础上做异构分层的优化设计。这种开放性使得ARM在设计高带宽内存(LPDDR)整合时更受欢迎。
第三,矩阵运算优化。Transformer模型中用到最多的矩阵乘法,在ARM上的优化比x86高效得多。x86虽然也能高效做矩阵乘法,但想要达到相同吞吐的能效和面积效率,就不如ARM的向量方案,在端侧不划算。如果你关心兼容性和成熟度,可以选择x86;但如果关心性价比和功耗(未来巨大的成本选项),ARM优势明显。
从产业趋势看,AI正从训练转向推理,尤其是向Agentic AI(代理式人工智能)发展。这不仅是大模型对话,还涉及大量API调用、网络和文件调用,这些都依赖CPU。ARM作为CPU,在端侧(PC、手机、汽车等)的Agentic AI应用中充满期待。我认为大方向是对的,产业拐点的认识已经形成。但短期股价波动会非常大,长期看这些大方向的落地会夯实价值。长期是称重机,短期是情绪投票器。
孙骋:英伟达上周下跌2.58%,市场担忧其增长放缓。AMD上涨3.60%。在AI芯片领域,英伟达的CUDA生态护城河是否依然牢固?AMD的MI系列GPU在推理场景中能否缩小差距?客户自研芯片对英伟达的威胁有多大?
王淮:在训练端,目前没有人能撼动英伟达的地位。但随着大模型普及和Agentic AI的发展,推理端算力需求大幅提升,这给了其他玩家机会。推理端的需求更加复杂,需要CPU、GPU、NPU等异构架构协同设计,对内存要求也很高。这让AMD等厂商真正获得了分一杯羹的机会。
AMD在推理端肯定会受益于“天下苦英伟达久矣”的情绪。企业需要一个可靠的第二供应商来保证供应链安全,避免被单一供应商卡脖子。因此,只要有一个可行的第二供应商出现,客户就会给予额外倾斜。AMD数据中心业务增速显著,但整体营收增长仍远低于股价涨幅,这当中当然有情绪波动的因素在,但市场对推理端巨大机会的释放是真实的。
对于英伟达,推理端的销售多少会受到影响,但并非致命。CUDA的护城河不是一天两天能被轻易超越的。同时,谷歌、微软、亚马逊等都在自研推理芯片,一方面是减少对单一供应商的依赖,另一方面是可以针对自己擅长的场景做定制化异构设计。这个趋势很明显。但最泛用的、通用性最强的芯片仍然是英伟达。未来两三年,即使在推理端,英伟达仍然会占据主要份额,只是集中度不会像训练端那么高。训练端短期内没有实质性挑战者。
孙骋:市场观点认为,AI投资正从“训练算力”转向“推理应用”。从实际部署来看,当前全球AI工作负载中训练与推理的比例大概是多少?未来两年推理占比会如何变化?这种切换对芯片设计、存储带宽、功耗等提出了哪些新的技术挑战?
王淮:我查阅了一些报告,目前推理与训练所占用的算力负载比例大约在6:4或5.5:4.5,推理已经超过了训练。但资本支出(Capex)是反过来的,训练仍占六成,推理占四成,因为训练所需的超级节点成本更高。
未来推理占比会大幅提升。一方面,大模型应用在全球的普及率其实还很低。数据显示,地球上从未接触过大模型应用的人还占86%。除了中美两国,很多国家的大模型应用很少。另一方面,Agentic AI会大幅增加对大模型的调用次数。未来三到五年,推理算力占比达到七到八成是完全有可能的。
另一个原因是训练端的迭代速度在大幅放缓。能做大型模型训练的公司正在集中,越来越少的企业负担得起训练成本。竞争减少后,企业会更倾向于将现有模型商业化变现,而不是快速推出新模型。训练端算力需求相对降低。除非未来具身智能或世界模型等领域出现新的万卡级别训练突破,那可能成为新的变量。
这种从训练到推理的切换,对芯片设计提出了更高要求。推理端对成本、功耗和延迟极为敏感,且需要适配从云到端的多样化场景,这就为不同架构(如GPU、ASIC、CPU)提供了细分切入机会。对内存带宽和上下文缓存(KV Cache)的要求也比训练端更加复杂。这些技术挑战恰恰给了ARM这类架构和存储芯片更多的市场机会。
声明:本文由入驻金色财经的作者撰写,观点仅代表作者本人,绝不代表金色财经赞同其观点或证实其描述。
提示:投资有风险,入市须谨慎。本资讯不作为投资理财建议。
金色精选
比推 Bitpush News
红流AKASHIO
Foresight News
比推 Bitpush News
金色精选
比推 Bitpush News
Foresight News
