作者:张烽
从租舰到造舰:DeepSeek自建算力基座,上海是否成为战略锚点?
2026年6月9日,DeepSeek官网悄然上线了一则“IDC设计规划工程师”招聘信息,工作地点位于杭州。岗位说明中包含一段极具信号意义的表述:“你将有机会参与从MW(兆瓦)到GW(吉瓦)级基础设施的规划与建设”。这是DeepSeek首次向外界释放自建算力基础设施的明确信号。
2026年4月,DeepSeek-V4开源发布,V4-Pro单token推理FLOPs仅为V3.2的27%,KV缓存占用降至10%;V4-Flash两个指标分别降至10%和7%。DeepSeek已经通过架构创新将单位推理成本压缩至行业最低水平。然而,推理效率的极致优化只是“算法效率”层面的胜利。AI大模型竞争的决胜点正在从“算法创新”延伸至“算力基础设施”——谁的推理基座能以最低边际成本持续输出服务,谁就能在下一阶段确立真正的不对称优势。
从算法效率到基座效率的跃迁,本质上是一个系统工程问题。上海在电力、芯片、网络三大维度上的独特禀赋,恰好构成这一跃迁的稀缺锚点。根据我们系统化推演,DeepSeek若选择上海自建算力基座,可能具有非对称优势,而完成从“可用”到“不可替代”的战略升级。
截至2025年底,中国AI训练算力投资增速远超推理部署效率的提升,这是当前算力基础设施面临的深层结构性矛盾。大批智算中心以“万卡集群”为标准建设,但PUE达标率、算力利用率、跨域协同效率普遍不理想。这种“投资热”与“运营冷”之间的错配,正是DeepSeek自建算力基座需要直接面对的行业背景。
更根本的结构性裂缝在于:训练算力与推理成本的倒挂关系正在反转。 大型模型预训练的固定投入居高不下,但模型交付后的推理服务才是真正高频消耗算力的长尾场景。千亿参数模型的持续服务,其推理端算力总消耗量将在生命周期内远超训练成本。当模型服务从“兴奋期”进入“常态化”阶段,供电成本、制冷成本、运维成本将占TCO的主要比例。
DeepSeek自建算力,正是意识到“租舰”模式——依赖公有云或第三方算力——在长期运营中存在边际成本不可控的风险。自建基座的本质是“建舰队”——把电力、散热、芯片、网络、运维这些后端能力以工程一体化的方式锁定在最优成本曲线上。而上海,恰恰是中国唯一能够系统性支撑这一工程的城市。

上海在AI基础设施领域的前瞻布局,政策方向已高度清晰。2025年3月,上海市经信委发布《上海市关于促进智算云产业创新发展的实施意见(2025-2027年)》,明确到2027年智算云产业规模突破2000亿元,智算规模达200EFLOPS,其中自主可控算力占比超70%。政策提出探索“基金投资+算力入股”等新型投资方式,2026年2月进一步强调“强化‘人工智能+’新兴业态基础支撑,优化布局算力设施,加强算力券支持和智能算力普惠供给”。
三个关键趋势方向值得特别关注:
趋势一:训练与推理成本的“剪刀差”正在发生结构性反转。 当前智算需求正加速从训练侧向推理侧转移。DeepSeek-V4的发布为此提供了有力佐证——V4-Pro单token推理算力仅为V3.2的27%,KV缓存占用降至10%,缓存命中输入价格降至0.025元/百万token-。DeepSeek的极致推理优化,恰好与上海正在推进的异构算力协同方案形成了深层耦合。
趋势二:电力已成为算力基础设施中最稀缺的生产要素之一。 上海2025年新建数据中心的PUE指标要求已趋严至1.25以内。更为关键的是,上海临港在全球率先实现了“海上风电直连+海水自然冷却”的绿色算力范式——数据中心直接接入海上风电场,绿电直供比例超95%,PUE不高于1.15。
趋势三:国产芯片的“适配战场”正在从实验室走向大规模部署。 上海成为中国唯一拥有壁仞科技、沐曦股份、燧原科技三家头部GPU企业的城市——三者均诞生于上海、成长于上海。壁仞科技2026年初登陆港交所,市值一度冲破1000亿港元;沐曦曦云C600已进入风险量产,预计2026年上半年正式量产,性能介于A100和H100之间,实现了从芯片设计到封装测试的全流程国产供应链闭环。2025年中国AI加速卡市场中国产份额已达41%,2026年预计升至超60%-——DeepSeek-V4在发布首日即完成了华为昇腾等国产芯片的深度适配,这一“DAY0生态适配力”正是上海国产芯片产业集群所需要的稀缺产品级验证能力。
DeepSeek若将自建算力基座部署在上海,其战略价值不能简单归结为“在上海建一个更大的数据中心”,而应聚焦于利用上海在电力、芯片、网络三端的非对称禀赋,构建三个层面的差异化竞争力。
绿色算力锁定长期运营成本优势。 大规模AI推理向超长上下文、多轮对话、高并发实时交互演进的过程中,电力成本在TCO中的占比将持续攀升。临港的海风直连数据中心模式,绿电直供比例超95%、PUE不高于1.15。这种将海上风电、海水冷却、模块化部署融合的方案,本质上为大规模AI推理服务提供了年度运营成本的长期锁定机制。对于聚焦高性能低成本推理的DeepSeek,临港模式不仅关乎边际成本,更关乎长期竞争壁垒——当其他模型厂商只能以市场价购买电力时,DeepSeek的推理基座能在较低边际成本曲线上运行,这是一种无人能快速复制的战略资产。
国产芯片适配的正反馈循环。 2025年中国AI加速卡市场国产份额达41%,DeepSeek-V4在发布首日即完成华为昇腾的全面适配-——这一适配深度和速度,本身就是DeepSeek工程能力的最好证明。如果DeepSeek将自建算力基座落地上海,即可与壁仞、沐曦、燧原三家头部国产GPU厂商在地理上形成紧密的产业集群,构建“DeepSeek真实负载运行→暴露芯片工程短板→反馈架构优化→芯片迭代升级→更大规模部署”的正反馈循环。这种产业集群效应和实时反馈机制,是中国其他任何城市都无法复制的核心资产。
非中心化推理网络的试验场。 中国电信在临港建设中国首个国产单池万卡液冷算力集群,投资86.61亿元,规划万P级智算节点。若DeepSeek将自建基座与公共智算中心形成“核心训练+边缘推理”的分层协同体系,则可以依托上海城域光网络的布局优势,构建中国首个“非中心化推理网络”——训练在临港大集群,推理调度在全市边缘算力节点,平衡算力成本与推理时延。2026年4月,上海AI实验室发布的DeepLink混合推理方案,首次基于多种国产异构算力实现预填充和解码分离,将推理时延大幅优化。DeepSeek完全有能力成为该方案的首个规模化“试运行用户”,用真实负载检验混推效能,与上海形成“方案+算力负载”的正反馈协同。
DeepSeek在沪自建算力基础设施的回报,不能以“节约了多少成本”来衡量,而应被视为一条阶梯式能力积累路径。这条路径的核心逻辑是:每一次投入都产生可复用的能力资产,而非一次性消耗。
第一阶(2026-2027年):可用基础设施——建立国产算力部署的基准基线。 在临港或浦东智算核心区域建立自建算力中心,此阶段的核心目标是验证上海绿电成本优势的实际表现,完成DeepSeek全量模型在国产算力(华为昇腾、壁仞、沐曦等)上的全栈迁移与深度适配。上海正推动“国芯国模国云”体系建设,DeepSeek的V4系列已深度适配昇腾等国产算力-,在这一阶段可以将适配从“可用”推进至“高效”。这一阶段的核心产出不是“多了一个数据中心”,而是DeepSeek首次掌握了国产算力的大规模部署能力,这是后续所有增长的基础锚点。
第二阶(2027-2028年):高可用基础设施——构建跨域无损推理网络。 建成“训练—推理混合调度”架构,利用上海城域光网络的优势(目标城域算力1毫秒时延圈覆盖率超75%),打通自建集群与上海公共智算中心的算力协同,形成中国首个规模化跨域无损推理网络。这一阶段的核心价值在于:DeepSeek将拥有完整的混合算力编排能力,而不仅仅是“拥有一批服务器”。
第三阶(2028-2030年):不可替代的战略设施——参与定义下一代智能网络接口。 将上海DeepSeek算力基座与中国6G标准中的“网络内生智能”接口深度耦合,成为中国“人工智能+信息通信”战略中的行业参考架构。当前信通院已提出“通感算智一体化”的技术愿景,上海在6G、光网络等领域的标准制定过程中拥有深厚积累。若DeepSeek能在上海率先验证“核心推理集群—边缘智能节点—分布式终端”的全链路端到端方案,就有机会从“被动适配”升级为“定义接口”,这是超越算力规模竞争的战略分野。
无论AI技术路线在未来十年如何演进,算力基础设施的核心约束条件不会改变。识别这些不变量,才能推演DeepSeek上海算力布局的真正长期价值。
不变量一:电力约束决定算力规模的上限。 算力即功耗,没有电力就没有算力。临港“海风直连”绿电直供比例超95%的绿色算力模式,在中国算力中心中具备稀缺性。在碳达峰、碳中和的宏观背景下,数据中心的PUE要求和绿电比例将从“建议”升级为“强制门槛”。上海在这一领域的制度领先和技术先行优势,本身就构成了其他城市在短期内难以跨越的竞争护城河——它们要达到相同的绿电比例,需要跨越更高的政策审批壁垒、更长的基础设施建设周期和更昂贵的电力改造成本。
不变量二:推理时延约束决定边缘节点的物理布局。 随着智能体应用向实时交互、工业控制等高精度场景延伸,推理服务的时延容忍度逼近极限。上海作为长三角经济枢纽和全国5G网络覆盖密度第一梯队的城市,接入全国IP骨干网的速率和时延优势极其显著。DeepSeek在沪自建集群不仅是“一个数据中心”,更是接入一张覆盖长三角高价值商业区域的低时延推理网络的基座节点——这一地理禀赋是无法通过单纯增加算力规模复制的。
不变量三:数据安全约束决定“本地化部署”的差异化价值。 金融、制造、医疗等高价值垂直行业对数据出境高度敏感,模型推理服务必须就近部署于境内高安全等级的数据中心。上海临港新片区在数据跨境制度创新上处于全国领先地位,已集聚大量龙头企业和算力中心-。临港海底数据中心的设计也充分考虑了数据主权和合规性的前置要求。DeepSeek若在临港部署算力基座,即可为这些高敏感行业提供“数据不出园区、推理不跨境”的合规推理服务——这是与通用API路线不同的、具备更高进入门槛的差异化竞争通路。
理论推演只有在可验证的假设下才具有实际意义。DeepSeek自建算力基座存在一个“最小可验证单元”——它不需要立即建设完整的GW级数据中心,但足以在数月内验证上述三个非对称优势中的核心两条。
具体行动建议:在临港智算园区设立“DeepSeek国产算力适配验证中心”。
尽管DeepSeek的首个IDC岗位位于杭州,但从上海在绿电、芯片和网络三端的非对称优势来看——尤其是临港已形成全国最密集的国产GPU企业集群,以及全球首个海风直连海底数据中心的正式投用——DeepSeek完全有条件在上海先行设立一个适配验证型的小规模算力环境。
核心验证任务:(1)在海上风电直连供电模式下,运行DeepSeek-V4全量推理负载,采集真实能耗数据,验证绿电的长期经济性是否显著优于市场电;(2)在同一物理集群内,同步部署华为昇腾、壁仞、沐曦、燧原等多家国产GPU的推理服务,实测端到端吞吐量与能效比,输出行业首个公开的“多厂商国产GPU推理实测报告”;(3)在临港与上海市区两个地点同步部署推理服务,通过上海城域光网络实测跨域推理时延,收集“核心训练+边缘推理”架构的第一手数据。
验证成功的关键指标: 在绿电直供模式下,DeepSeek-V4推理的单位Token全链路成本(含电力、制冷、运维)是否显著低于国内一线公有云报价;至少与一家上海头部国产GPU厂商完成全量模型的大规模适配,推理吞吐量达到或接近英伟达同级产品的70%以上,并将适配和测试结果通过开源社区公开,形成行业影响力。
为什么这是“最小火种”? 这一适配验证中心的启动成本仅相当于DeepSeek年度研发预算的一个零头,但能回答上述分析中最关键的两个问号:绿电的成本优势在真实负载下是否成立?国产芯片的适配深度能否支撑商业级推理服务?如果验证通过,第二阶段即可扩展至数千卡规模的集群;如果验证结果不理想——例如绿电成本优势被非技术因素抵消、或国产芯片适配仍存在工程门槛——DeepSeek可以快速调整选址或技术路线,不会陷入重资产投资的困境。最小火种的核心原则是:让最具决定性的未知项在可控成本下得到验证,再将成功经验放大到更大规模。
更宏观的判断: 当前中国AI基础设施竞争的决胜点不是“谁拥有最多的卡”,而是“谁的算力基座能以最低的边际成本持续输出推理服务”。DeepSeek已经通过V4的架构创新在“算法效率”端做到了行业领先,下一步的关键是“将算法效率转化为基座效率”。上海在电力、芯片和网络三端的非对称禀赋,使其成为中国唯一能够系统性完成这一命题的城市。从杭州招聘到临港落地,DeepSeek或许将以此完成从“算法领先”到“基座领先”的战略跃迁。
声明:本文由入驻金色财经的作者撰写,观点仅代表作者本人,绝不代表金色财经赞同其观点或证实其描述。
提示:投资有风险,入市须谨慎。本资讯不作为投资理财建议。
区块链骑士
华泰睿思
吴说Real
比推BitpushNews
数字新财报
腾讯科技
