智算多多



英伟达最新一代AI芯片Rubin GPU原计划于今年晚些时候出货,但受持续的地缘政治压力和供应链限制影响,可能面临供货延迟。
据TrendForce研究机构预测,Rubin GPU在英伟达整体出货量中的占比,已从此前预期的29%下调至2026年约22%的较低水平。该机构指出,导致延迟的主要挑战包括:HBM4验证问题、网络互连从CX8向CX9的切换、更高功耗的管理,以及在更先进液冷方案下的性能优化。
此次延迟可能对下一波AI基础设施升级浪潮产生深远影响。英伟达方面暂未回应置评请求。
英伟达现有的Blackwell和Hopper架构目前仍能满足模型训练与推理的计算需求。然而,Rubin并非一次常规的GPU升级,其设计目标是通过提升计算密度、内存带宽和整体效率,从根本上改善大规模AI的经济性。
Rubin旨在降低每Token的成本,减少大型工作负载所需的GPU数量,并使大规模推理在经济上具备可持续性。这一点尤为重要,特别是在AI向智能体工作负载演进、计算需求成倍增长的背景下。
Rubin平台原本预计率先被超大规模云服务商和AI原生企业采用,这些机构具备支撑高密度系统、先进散热及高度集成架构的基础设施能力。
通常情况下,超大规模云服务商会率先采购先进GPU,在内部部署并通过云平台对外提供,企业客户则在此后6至12个月内通过API和云服务逐步获得访问权限。
超大规模云服务商将通过延长Blackwell的使用周期、优先部署高ROI工作负载来消化初期冲击,同时压缩对外开放的算力资源。这将收紧云端算力的可用性,加剧定价波动,并进一步凸显预留算力资源的重要性。
他补充称,企业用户可能面临二阶影响,包括云端AI基础设施访问受限,以及下一代实例上线时间延迟。
Rubin的推迟上市不太可能叫停企业的AI建设进程,但会影响部署时间表和成本预期。
Gogia指出,许多企业的AI战略在一定程度上都隐性依赖于未来硬件来弥补当下的效率短板,例如更高的性价比、更强的计算密度和更好的能效表现。
这不会导致AI活动停滞,但会带来更分阶段的部署节奏、更多的混合消费模式,以及更严格的财务审查。企业将优先考虑以推理为主导的部署方案、规模较小的计算集群,以及允许弹性扩展的混合架构,以避免过早锁定某一特定硬件路线。
Rawat则指出,这一局面可能加速企业向AMD及定制芯片等替代方案的分散化布局,同时推动业界更加关注CUDA之外的软件可移植性。
此次延迟的影响将在私有AI集群和AI工厂等大型部署场景中更为显著。
Rubin代表着向系统级AI基础设施的转变,专为具备高效成本和高吞吐量的全天候AI工厂而优化。一旦延迟,企业将继续在英伟达Blackwell和Hopper平台上推进部署,虽然技术方向得以延续,但经济性将有所下降,具体表现为利用率偏低、能耗成本上升以及硬件投入加大。
TrendForce预计,在Rubin缺席的情况下,企业将持续依赖以Blackwell为代表的现有平台,预计该平台2026年的出货占比将超过70%,主要由GB300或B300系列产品主导。
Rawat表示,部署周期可能拉长数个季度,形成临时性的需求递延,而非真实需求的消失。由于AI采用仍以实际工作负载为驱动,短期内或存在一定摩擦,但一旦Rubin平台大规模落地,需求有望迎来集中爆发。
Q1:英伟达Rubin GPU为什么会出现延迟?
A:根据TrendForce的分析,Rubin GPU的延迟主要源于多项技术与供应链挑战,包括HBM4内存的验证问题、网络互连从CX8升级至CX9的过渡难度、更高功耗的管理需求,以及在先进液冷方案下的性能优化问题。此外,持续的地缘政治压力和供应链限制也是重要外部因素。受此影响,Rubin在2026年出货量中的占比预计从29%下调至22%。
Q2:Rubin GPU延迟对企业AI部署有什么影响?
A:Rubin GPU延迟不会叫停企业的AI建设,但会影响部署节奏和成本预期。企业将更倾向于以推理为主导的部署、小型计算集群和混合架构,以避免过早绑定特定硬件。同时,云端AI算力可用性收紧、定价波动加剧,企业获取下一代云实例的时间也将相应推迟。此外,部分企业可能加速转向AMD及定制芯片等替代方案。
Q3:Rubin GPU延迟后,英伟达Blackwell平台的市场地位会如何变化?
A:在Rubin缺席的情况下,英伟达Blackwell平台的市场地位将进一步巩固。TrendForce预计,2026年Blackwell平台的出货占比将超过70%,主要由GB300或B300系列产品主导。超大规模云服务商也将通过延长Blackwell使用周期来应对Rubin的供货延迟,企业用户同样将继续依赖Blackwell和Hopper架构推进现有AI部署。