智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


京公网安备11010602202532号 Rubin最容易被市场误读的地方,是大家会习惯性地把它当成一颗新GPU。
但英伟达现在要卖的,已经不是一颗颗芯片,而是一套可以直接部署、可以规模复制、可以计算回报率的AI工厂。
摩根士丹利预计,英伟达会在Computex展示Rubin相关的机架级设计,包括NVL、LPU、Vera CPU、BlueField、NVSwitch等组合。这个组合的意义,不是把硬件名称堆在一起,而是要让训练、推理、存储、网络、调度和安全形成闭环。
这背后对应的是AI资本开支的一个新阶段。
Rubin如果能成立,最大的价值不是峰值算力,而是帮助客户把AI业务的单位成本继续打下去。尤其进入Agent时代以后,推理调用会变得更频繁,Token消耗会比过去更大。企业客户真正关心的不是模型有多炫,而是一次调用多少钱,一次任务能不能覆盖成本。
Rubin的竞争,其实是成本曲线竞争。市场此前担心Rubin GPU能否实现2.3kW热设计功耗目标。摩根士丹利的说法是,Rubin已回退至原有芯片散热方案,实现了1.8kW TDP,但通过服务器系统散热协同,2.3kW目标依然可以实现。
AI硬件的瓶颈不再只是芯片设计,而是系统工程。GPU再强,也要靠液冷、电源、机柜、PCB、连接器、散热材料和整机制造一起配合。换句话说,AI产业链的利润池正在从GPU本体,向机架级系统外溢。
这也是为什么光模块、PCB、液冷、电源、服务器ODM、先进封装载板都会被市场反复交易。
系统越复杂,越考验供应链协同。功耗控制、散热方案、HBM供应、CoWoS产能、良率、整机验证,只要一个环节延迟,就会影响Rubin放量节奏。所以,Rubin不是简单的新品周期,而是一次AI供应链压力测试。Blackwell证明了英伟达能卖整柜系统,Rubin要证明英伟达能卖更低Token成本的AI工厂。
市场最终交易的,不是Rubin有多强,而是它能不能让云厂商继续加码下一轮资本开支。
Computex第二个核心变量,是Vera CPU。
这可能是市场低估的部分。
过去英伟达的叙事核心是GPU。只要GPU供不应求,英伟达就是AI时代最强的硬件入口。但AI工厂进入推理时代后,CPU的重要性正在被重新抬高。
原因很简单,Agentic AI、长上下文、多轮推理、数据调度、存储访问、网络通信,都不是GPU单独能解决的。AI系统越大,GPU和CPU之间的协同越重要。CPU不再只是传统服务器里的通用计算核心,而会越来越像AI工厂的调度节点。
摩根士丹利预计,英伟达会披露更多Vera CPU细节,并认为这代表一个高达200亿美元的市场机遇。供应链调研显示,台积电正在为Vera CPU分配额外CoWoS-R产能和3nm晶圆,合理出货假设达到150万颗。
以前英伟达吃的是GPU利润池。Vera CPU出现后,它可能进一步进入AI服务器CPU、系统调度、整机架控制和数据中心基础架构。它要对客户说的不是“买我的GPU”,而是“AI工厂里的CPU、GPU、DPU、交换机、网络系统,都可以按我的架构来”。
这对AMD和英特尔不是小压力,英特尔和AMD的优势,在x86生态、传统数据中心客户基础和通用CPU软件兼容。但英伟达的优势,是AI系统定义权。只要未来数据中心的核心工作负载越来越围绕GPU集群和推理效率展开,CPU就会从传统主角变成AI系统里的协同角色。
这个角色,英伟达当然想自己做。Vera CPU潜在客户包括微软、Meta、CoreWeave、甲骨文等大型科技企业和云服务商。这些客户买的也不是孤立CPU,而是一套和Rubin GPU深度耦合的系统方案。
这才是英伟达最强的地方,它控制GPU,就控制训练和推理核心;控制NVLink和NVSwitch,就控制集群内部通信;控制BlueField和Spectrum,就控制网络、安全和数据流;如果再控制Vera CPU,它就更接近AI数据中心架构控制者。
但这条路也不是没有阻力。CPU市场不是空白市场。x86生态很深,云厂商也不愿意被单一供应商完全锁死。亚马逊有Graviton,谷歌有TPU和自研基础设施,微软、Meta也在推进自己的ASIC和内部芯片路线。
云厂商会买英伟达,但它们也会防英伟达,所以Vera CPU的商业化,不只是性能问题,更是客户愿意让英伟达控制多少系统话语权的问题。
这个冲突,反而是后续最值得跟踪的地方。Vera如果成功,英伟达的估值逻辑会继续从GPU公司切向AI工厂平台公司;Vera如果不及预期,市场也会发现,英伟达虽然很强,但云厂商仍然在系统层面保留制衡。
第三条线,是台积电CoWoS和先进封装。
Rubin和Vera的故事能不能兑现,最后都要落到产能上。AI算力不是发布会喊出来的,它必须被晶圆厂、封装厂、内存厂和ODM厂一点点生产出来。
这也是摩根士丹利上调台积电CoWoS产能预期的原因。
报告将台积电2027年CoWoS产能预测从每月16万至17万片晶圆,大幅上调至20万片。这个变化不是小修小补,而是市场对AI芯片需求再次上修的信号。
CoWoS为什么重要?
因为它已经是高端AI芯片交付的闸门。英伟达、AMD、博通、云厂商自研ASIC,都要用到先进封装。晶圆做出来只是第一步,GPU和HBM能不能高带宽、低功耗、高良率地封在一起,才决定它能不能真正出货。
台积电为了满足订单,正在把Fab 15A的28/22nm产能空间转向55nm中介层生产,预计今年新增约1万片/月产能。这个动作说明,AI先进封装已经开始挤压部分成熟制程资源。
这种挤压会带来连锁反应。
一方面,台积电的定价权进一步增强。AI客户离不开台积电,不只是因为先进制程,也因为CoWoS、SoIC和系统级封装能力。先进封装已经不是后道配套,而是台积电提高客户黏性的重要工具。
另一方面,联电可能承接部分成熟制程溢出订单。摩根士丹利提到,台积电部分28/22nm产能被挤出后,联电有望承接来自索尼的图像信号处理器订单。这说明AI算力的影响已经不只在英伟达和台积电之间,而是在重新分配整个半导体产能结构。
SoIC也会被市场继续重估,苹果、AMD、英伟达都是SoIC核心客户。未来AI芯片越来越依赖Chiplet和3D堆叠,SoIC的战略价值会继续上升。CoWoS解决2.5D集成,SoIC解决更高密度的3D集成,两者一起决定下一代AI芯片的封装上限。
同样,液冷、电源、PCB、光模块也要看订单验证。AI系统成本正在快速抬升,HBM、PCB、液冷、电源、机柜都会占据更大比重。云厂商是否继续加码,最终取决于AI应用收入能否支撑资本开支回报率。
所以,AI硬件下一步真正短缺的,不只是GPU,而是让GPU大规模跑起来的一切。HBM短缺,CoWoS短缺,高速PCB短缺,光互连短缺,液冷能力短缺,电力资源短缺,甚至AI应用商业回报也可能短缺。
Computex 2026最重要的看点,不是黄仁勋会不会再带来一颗“核弹”。
真正重要的是,英伟达正在把AI基础设施重新定义成一座工厂。
在这座工厂里,GPU负责生产智能,CPU负责调度系统,NVLink和NVSwitch负责连接,BlueField和Spectrum负责网络与安全,CoWoS和SoIC负责把芯片拼在一起,液冷和电力负责让机器持续运转。
这套体系一旦成立,AI硬件投资就会进入新的阶段。
过去市场买的是AI概念,后来买的是GPU稀缺,再后来买的是整柜系统。下一阶段,市场会买真正的瓶颈资产。
什么是瓶颈资产?
不是喊AI最大声的公司,而是订单最紧、产能最缺、良率最难、客户最愿意提前锁货的环节。
Rubin能不能继续压低单Token成本,Vera CPU能不能打开AI服务器CPU新市场,CoWoS和SoIC能不能跟上AI工厂扩张节奏,这三个问题会决定英伟达供应链下一轮行情高度。
如果三件事同时成立,AI硬件主线不会结束,只会从GPU龙头行情进入系统瓶颈行情。
如果功耗、良率、HBM、封装、云厂商ROI其中任何一环出现扰动,市场也会重新审视这轮AI基础设施行情的估值高度。
所以,Computex这次真正值得看的,不是参数,而是分工。
黄仁勋要告诉市场:未来AI产业链谁负责定义架构,谁负责制造封装,谁负责供应内存,谁负责连接,谁负责散热,谁负责交付整柜。
这张分工表,才是未来两年AI投资最重要的作战地图。
