免责声明：金色财经所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（jinse.com.cn）举报

美股“芯片万岁”行情什么时候结束

金色精选

刚刚

关注

作者：孙骋；来源：Barrons巴伦

4月的美股沉浸在一场由AI主导的结构性狂欢之中，纳指单月暴涨15.3%，标普500上涨10.4%，费城半导体指数更是创下2000年以来最大单月涨幅。5月之后，市场的剧本便迅速翻篇，美股三大指数高位震荡，表面的平静之下，暗流汹涌：ARM凭借财报利好股价单周狂飙42.58%，闪迪、希捷等存储龙头单周涨幅均超15%，而曾经的AI“旗手”英伟达、微软股价下跌。

这是AI主线的熄火，还是一场深刻的内部切换？资金正在从GPU和云巨头流向ARM架构与存储芯片，市场似乎在交易“训练算力见顶、端侧推理与存储接棒”的新逻辑。道指创出新高，是否意味着风格轮动已然开启？ARM的暴涨是价值重估的起点，还是短期泡沫的顶点？

重要观点：

1、AI热潮未结束，但进入精细化分化阶段：资金仍在持续流入AI领域，但已从普涨转向选择性下注。市场内部从GPU和云巨头流向ARM架构与存储芯片，交易逻辑切换为“训练算力见顶、端侧推理与存储接棒”。

2、资金抱团效应强劲，只是抱团对象切换：量化交易、末日期权和杠杆ETF改变了市场生态，做市商对冲行为加剧助涨助跌。抱团效应并未消退，而是从英伟达等标的转移至ARM、闪迪等新热点，导致“涨到颠覆三观”。

3、ARM暴涨属典型逼空行情，不可持续：伽马挤压与空头挤压相互叠加，导致股价短期狂飙。这种走势无法永远持续，一旦买盘耗尽或情绪动摇，股价可能快速掉头向下，需格外小心。

4、ARM架构在端侧推理具备本质优势：作为RISC精简指令集，ARM能效比x86低近一半；IP授权模式支持定制化异构设计；矩阵运算优化更适配Transformer模型。产业长期拐点已形成，但短期股价波动剧烈。

5、英伟达训练端地位稳固，推理端面临挑战：CUDA生态护城河难以逾越，训练端无实质挑战者。但在推理端，AMD及谷歌、微软等自研芯片因“天下苦英伟达久矣”获得倾斜机会，未来英伟达份额将降低但仍是主力。

6、推理算力负载已超训练，未来占比达七至八成：目前推理与训练算力负载约6:4，但资本支出仍训练占六成。随着大模型普及和Agentic AI发展，加上训练迭代放缓，推理端对成本、功耗、延迟的严苛要求为ARM、存储芯片带来新机遇。

行情回顾：AI主导的狂欢是起点还是泡沫？

孙骋：AI主导的上涨潮结束了吗？资金从GPU/云巨头流向ARM和存储，背后的核心驱动力是什么？

猫姐：从2023年开始，美股就已经开始对AI进行重点关注。整个2023年最明星的个股就是英伟达，它属于半导体，但主要驱动力就是AI。这一波行情从那时起一直持续到2024年、2025年，到现在已经是分层次、节奏地全面开花的状态。所以，AI热潮现在说它结束还为时过早。

从我们最新监控的上周五美股数据来看，进入AI领域的资金仍然没有出现任何衰减的迹象。但这里面有一个显著特点，就是“分化中的分化”。我们看到整个美股大盘从去年10月份开始就进入了滞涨状态，10月到2月一直在横盘。在大盘横盘的过程中，一些软件股以及受AI冲击的部分大科技股，实际上已经出现了衰竭和回调。但同样是大盘横盘甚至下跌的这段时间，一些AI的热门板块，比如存储和光通信，这些板块不但没跌，反而是上涨的，这就体现了市场分化和资金重点方向。

所以，未来从资金监控来看，无论是新买家还是存量买入方，都依然非常积极。但市场呈现出一个持续的态势，就是在AI这个大板块内部，资金不断去寻找热点、寻找分化、寻找新的题材和不同赛道的公司。因此，上涨潮并未结束，而是进入了一个更加精细化的阶段。

孙骋：纳指、标普500创近六年最佳月度表现，费城半导体指数创2000年以来最大单月涨幅。这种极端行情背后，除了AI驱动，市场情绪修复和资金抱团效应具体体现在哪些方面？5月中旬后市场并未继续普涨，是否意味着市场情绪从“整体乐观”转向“选择性下注”？抱团效应是否依然存在？

猫姐：这可以从两个方面来看。一方面是美股典型的技术性行情。通常来说，在长时间横盘和下跌之后，美股会迎来一轮报复性上涨，比如2020年的行情，以及2023年8月到10月底3个月的回调后迎来的近半年暴涨。从去年10月份开始，美股大盘陷入了停滞状态，重心点位在几个月内都没有变化，这是典型的蓄势整理。3月份的最后一跌是一次严重的估值回调，3月30号成为这轮底部。因此，4月份开始的暴涨，本质上是对之前近半年横盘的一种修复。美股的显著特点是“stay in the game”，你必须留在游戏里，因为反弹可能就在一两天内完成。统计显示，无论过去50年、30年还是10年，如果错过了全年中的这几个单日或几日反弹和暴涨的行情，全年的收益对比下来是差距很大的。

另一方面，资金抱团效应依然存在，但现在的市场与以前完全不同。量化交易、机器程序交易、散户的大量参与以及海量的期权和杠杆ETF，使得市场生态发生了根本性变化。做市商为了对冲风险，不得不采取一些行为，这些行为会加剧市场的助涨和助跌。特别是在AI头部热点个股上，所有散户都在做末日期权，而大户（资金体量大、对市场有影响的玩家）也在追逐这些热点。这造成了加速的助涨和助跌，导致近年来美股抱团效应越来越强，“涨到颠覆三观”的现象越来越多。因此，市场并非从乐观转向悲观，而是抱团的对象发生了变化，资金仍在集中，只是切换了标的。

孙骋：ARM单周涨幅超42%，两个交易日即完成如此巨大的涨幅。这在技术上是否已属于“逼空”行情？是否存在散户情绪或期权伽马挤压的助推？这种速度的上涨可持续吗？

猫姐：这确实是非常典型的逼空行情，其中伽马挤压效应起到了重要作用。现在的美股市场，一旦出现热点，所有机构、大户、散户都在追。大量末日期权的存在，会造成伽马挤压问题。做市商中，很多并不赌方向，而是靠做买卖赚取差价。当市场上大多数玩家都买入末日期权或近期价外看涨期权时，做市商面临巨大风险：一旦股票上涨，他们需要兑现期权，为了对冲风险（保持delta中性），他们不得不持续买入大量正股。买入的人越多，做市商需要买入的正股就越多，股价因此被疯狂推高。我们最近看到的许多美股尾盘30分钟效应，很多就是由这种挤压效应造成的。回过头来，看到股价一再被推高，兴奋的投资者又会继续加大仓位买入看涨期权，这继续倒逼做市商买入正股对冲。

此外还有空头挤压。一些投资者认为股价明显背离估值而选择做空，但由于上述机制导致股价继续上涨，空头最终被迫爆仓平仓、买入股票，形成空头相互碾压。在ARM这只股票上，如果这种走势持续时间更长、曲线更陡峭，就会成为逼空的典型。

关于可持续性，这种行情从技术上讲是无法永远持续下去的。一旦所有空头都缴械了，或者新买家信心稍微被股价波动所动摇，市场失去争议和缓冲垫，股价就容易在获利盘回吐或市场情绪稍有犹豫时快速掉头向下，而且和上涨一样也有迭加效应。因此，这种行情要格外小心。

AI科技深度剖析：ARM崛起、英伟达承压、存储接棒

孙骋：ARM上周暴涨42.58%，市场核心交易逻辑是“AI从训练转向端侧推理，ARM架构将大幅受益”。请您从技术角度分析：ARM的指令集和授权模式在AI推理场景中相比x86有哪些本质优势？这一轮价值重估是短期财报催化，还是产业长期拐点？

王淮：从技术层面看，市场现在转向以端侧推理为主的AI算力应用，这个大逻辑是比较明显的。ARM比x86更适合端侧的核心原因有三点：

第一，指令集优势。ARM是RISC（精简指令集），x86是CISC（复杂指令集）。RISC不需要将流水线设计得过于复杂，因此相同芯片面积下可以集成更多核心、缓存或专用加速单元，有利于近内存计算。在AI推理中，一个重大瓶颈就是内存通信。ARM具有灵活的物理IP和定制化能力，天然适合AI推理运算。在典型端侧负载下，ARM架构能效显著优于x86，功耗通常可低近一半，带来巨大的成本优势。

第二，授权模式优势。ARM是IP授权模式，客户可以在拿到授权后做定制化设计，比如将CPU与GPU、NPU如何配合，可以自由操作。而x86是一个“黑盒子”，很难在其基础上做异构分层的优化设计。这种开放性使得ARM在设计高带宽内存（LPDDR）整合时更受欢迎。

第三，矩阵运算优化。Transformer模型中用到最多的矩阵乘法，在ARM上的优化比x86高效得多。x86虽然也能高效做矩阵乘法，但想要达到相同吞吐的能效和面积效率，就不如ARM的向量方案，在端侧不划算。如果你关心兼容性和成熟度，可以选择x86；但如果关心性价比和功耗（未来巨大的成本选项），ARM优势明显。

从产业趋势看，AI正从训练转向推理，尤其是向Agentic AI（代理式人工智能）发展。这不仅是大模型对话，还涉及大量API调用、网络和文件调用，这些都依赖CPU。ARM作为CPU，在端侧（PC、手机、汽车等）的Agentic AI应用中充满期待。我认为大方向是对的，产业拐点的认识已经形成。但短期股价波动会非常大，长期看这些大方向的落地会夯实价值。长期是称重机，短期是情绪投票器。

孙骋：英伟达上周下跌2.58%，市场担忧其增长放缓。AMD上涨3.60%。在AI芯片领域，英伟达的CUDA生态护城河是否依然牢固？AMD的MI系列GPU在推理场景中能否缩小差距？客户自研芯片对英伟达的威胁有多大？

王淮：在训练端，目前没有人能撼动英伟达的地位。但随着大模型普及和Agentic AI的发展，推理端算力需求大幅提升，这给了其他玩家机会。推理端的需求更加复杂，需要CPU、GPU、NPU等异构架构协同设计，对内存要求也很高。这让AMD等厂商真正获得了分一杯羹的机会。

AMD在推理端肯定会受益于“天下苦英伟达久矣”的情绪。企业需要一个可靠的第二供应商来保证供应链安全，避免被单一供应商卡脖子。因此，只要有一个可行的第二供应商出现，客户就会给予额外倾斜。AMD数据中心业务增速显著，但整体营收增长仍远低于股价涨幅，这当中当然有情绪波动的因素在，但市场对推理端巨大机会的释放是真实的。

对于英伟达，推理端的销售多少会受到影响，但并非致命。CUDA的护城河不是一天两天能被轻易超越的。同时，谷歌、微软、亚马逊等都在自研推理芯片，一方面是减少对单一供应商的依赖，另一方面是可以针对自己擅长的场景做定制化异构设计。这个趋势很明显。但最泛用的、通用性最强的芯片仍然是英伟达。未来两三年，即使在推理端，英伟达仍然会占据主要份额，只是集中度不会像训练端那么高。训练端短期内没有实质性挑战者。

孙骋：市场观点认为，AI投资正从“训练算力”转向“推理应用”。从实际部署来看，当前全球AI工作负载中训练与推理的比例大概是多少？未来两年推理占比会如何变化？这种切换对芯片设计、存储带宽、功耗等提出了哪些新的技术挑战？

王淮：我查阅了一些报告，目前推理与训练所占用的算力负载比例大约在6:4或5.5:4.5，推理已经超过了训练。但资本支出（Capex）是反过来的，训练仍占六成，推理占四成，因为训练所需的超级节点成本更高。

未来推理占比会大幅提升。一方面，大模型应用在全球的普及率其实还很低。数据显示，地球上从未接触过大模型应用的人还占86%。除了中美两国，很多国家的大模型应用很少。另一方面，Agentic AI会大幅增加对大模型的调用次数。未来三到五年，推理算力占比达到七到八成是完全有可能的。

另一个原因是训练端的迭代速度在大幅放缓。能做大型模型训练的公司正在集中，越来越少的企业负担得起训练成本。竞争减少后，企业会更倾向于将现有模型商业化变现，而不是快速推出新模型。训练端算力需求相对降低。除非未来具身智能或世界模型等领域出现新的万卡级别训练突破，那可能成为新的变量。

这种从训练到推理的切换，对芯片设计提出了更高要求。推理端对成本、功耗和延迟极为敏感，且需要适配从云到端的多样化场景，这就为不同架构（如GPU、ASIC、CPU）提供了细分切入机会。对内存带宽和上下文缓存（KV Cache）的要求也比训练端更加复杂。这些技术挑战恰恰给了ARM这类架构和存储芯片更多的市场机会。