伯恩斯坦测算的 AI 服务器机柜物料成本构成
基于与行业专家的多轮交流、供应链调研,以及机柜外土地和实体基础设施成本的第三方数据,我们针对搭载 GB200 NVL72 的 AI 数据中心,测算并拆解了机柜层面的成本结构,本文将呈现相关分析结论与核心要点。
单柜与吉瓦级资本支出测算
我们测算,一台典型的 GB200 NVL72 机柜单柜成本约 350 万美元;叠加单柜约 250 万美元的实体基础设施成本,一台 AI 数据中心机柜的综合资本支出达 600 万美元,对应 1 吉瓦算力的总资本支出为 360 亿美元。
- GB200 NVL72 机柜单柜成本 350 万美元:结合行业专家观点,并考虑动态随机存取存储器(DRAM)和闪存(NAND)价格上涨因素(1),我们测算一台 “标准款” GB200 NVL72 机柜成本约 350 万美元。
- 1 吉瓦算力综合资本支出 360 亿美元:我们测算单柜机柜功耗为 132 千瓦,整柜总功耗为 169 千瓦(即机柜功耗占数据中心总功耗的 78%),由此推算 1 吉瓦算力对应约 5900 台机柜,机柜端总成本达 210 亿美元。此外,行业调研显示机柜外实体基础设施成本约 150 亿美元(折合单柜 250 万美元),因此 1 吉瓦算力的数据中心综合资本支出为机柜端与基础设施端成本之和,即单柜 600 万美元、总规模 360 亿美元。
- 英伟达的相关表述是否只是 “黄仁勋式的乐观”?尽管整体半导体行业、尤其是英伟达在每吉瓦算力中的市场机会无疑巨大,但我们的测算值显著低于英伟达 2026 年第二季度业绩电话会议中提及的 500-600 亿美元 / 吉瓦,反而与博通、超威(AMD)提出的每吉瓦约 150-200 亿美元可触达市场规模更为契合。业内人士明确表示,英伟达的估值偏高;而我们认为,该数值实则是英伟达对未来 GPU 迭代周期的预判 —— 届时单柜及每吉瓦算力的成本将进一步攀升。
GPU 与英伟达毛利占比
数据中心资本支出中,GPU 占比居首,我们测算其占总成本的 38%;英伟达的毛利额同样占比可观,约为总成本的 32%。
- 英伟达毛利额是 AI 数据中心物料成本中最大单项:英伟达的毛利率约为 75%,据此测算其毛利额占 AI 数据中心总支出的 32%,与机电设备总成本占比(约 31%)基本持平。尽管在 GPU 产业链利润分配中,英伟达的占比并非绝对主导,但 GPU 的整体支出规模庞大,使得高带宽存储器(HBM)、GPU 芯片及其他 GPU 相关成本,仍是物料成本构成中的重要项。
- 即便专用集成电路(ASIC)毛利率较低,仍是成本最大项:假设 GPU 与 ASIC 的销货成本(COGS)相同,而 ASIC 毛利率为 50%,则加速计算硬件的成本将从约 230 万美元降至 80 万美元,总资本支出节省约 25%,且 ASIC 仍占数据中心资本支出的 18% 左右。
- 中央处理器(CPU)是否仍具价值?整体而言仍有其作用:从表面看,CPU 仍是占比不低的成本项(占总资本支出的 4%),与交换机等被普遍认为是 AI 赛道受益者的组件占比基本持平。但相较于 GPU,CPU 的支出规模偏小,且 GPU 常与 CPU 整合为超级芯片,因此在整体硬件组合中,CPU 往往被视为附加组件。
网络设备成本结构
网络设备是另一大成本项,占总支出的约 12%,且其支出分散于各类设备中。交换机是最大的网络设备品类(占总支出的 3%),而铜缆(占 2%)、安费诺等企业供应的背板连接器(占 2%)等纵向扩展网络设备,以及网络加速器等横向扩展网络基础设施,同样是重要的成本构成。
- 交换机占总支出的 3%,网络设备厂商与交换机芯片设计商均享有高毛利率:尽管交换机并非最大成本项(约占纵向扩展网络设备的 40-50%,而纵向扩展网络设备占机柜成本的 10-15%),但仍占总支出的 3%,占比可观。我们还注意到,锐捷网络等网络设备厂商在交换机硬件上享有 60% 以上的高毛利率,交换机芯片设计商在芯片(销货成本的最大构成)上也拥有高毛利率,因此交换机在利润池中的占比,可能远高于其在终端用户支出中的占比。
- 数据处理单元(DPU,占 3%)、铜缆(占 2%)、背板连接器(占 2%)、网络接口控制器(NIC,占 2%)和光模块(占 1%),同样是重要的成本项。此外,随着共封装光学技术的逐步普及,多个品类的单柜搭载量或出现明显变化。
存储设备成本偏低
即便价格走高,存储设备的成本占比仍偏低,约为 2%。业内人士表示,一台标准机柜的存储容量约 2PB;若硬盘驱动器(HDD)单价为 0.01 美元 / GB,则单柜存储成本仅约 2 万美元,占机柜总成本的 0.6%。这也解释了为何数据中心运营商更看重功耗效率等因素,而非每 GB 存储单价;同时也能说明,即便存储内存价格上涨导致智能手机等行业需求萎缩,数据中心运营商仍愿意承担这一成本。
- 2PB 存储容量仅占机柜成本的 0.6%:如前文所述,标准机柜 2PB 存储容量对应 HDD 成本约 2 万美元,占机柜总成本的 0.6%,这一数值低于行业专家的反馈,原因可能是部分存储采用了成本更高的 NAND 闪存。
- 我们是否对四级单元(QLC)闪存的争议存在误判?HDD 与 NAND 的成本差异是否真的重要?这也为脸书(Meta)那份引发广泛讨论的白皮书(2)提供了新的解读视角 —— 该白皮书主张在数据中心中更广泛地使用 QLC NAND 闪存替代 HDD。即便 QLC 闪存的每 GB 成本远高于 HDD,但其带来的增量成本相较于数据中心总成本而言微乎其微;且正如 Meta 所言,在功耗受限的环境中,QLC 固态硬盘(SSD)的功耗效率优于 HDD 和三级单元(TLC)闪存,这一优势的重要性远超成本节省。
- 间接支出方面如何?尽管 AI 数据中心在存储上的直接支出偏低,但存储行业仍能从 AI 发展中获得间接收益。例如,戴尔等企业认为,企业级 AI 的落地将推动存储架构的升级,进而带动企业级存储设备的更新周期加快。
专用集成电路(ASIC)的市场机会
晶圆代工厂、高带宽存储器(HBM)、半导体设备厂商及其他上游供应商的价值获取能力,在 GPU 与 ASIC 产业链中存在显著差异。
- GB200 架构下的上游厂商机会:在 GB200 架构中,晶圆代工厂在 GPU 产业链的价值占比约 2.5-3%,网络设备与 HBM 的价值占比约 3-3.5%,晶圆制造设备(WFE)的价值占比约 3-4%。对于搭载 GB200 NVL72 的数据中心,我们测算晶圆代工厂通过 GPU、网络芯片等业务,可获取数据中心资本支出 2.5-3% 的价值;若 CPU 也由晶圆代工厂代工,该占比将再提升约 1%。存储供应商通过 HBM 业务获取 3-3.5% 的价值(不含传统 DRAM),晶圆制造设备供应商获取 3-4% 的价值。折算下来,晶圆代工厂每吉瓦算力的价值量为 11 亿美元,若包含 CPU 代工则增至 14 亿美元;存储企业通过 HBM 每吉瓦获利 11 亿美元,晶圆制造设备供应商每吉瓦获利 12 亿美元。
- ASIC 的低价格、低毛利与高销量,让上游厂商更具盈利空间:若数据中心采用基于 ASIC 的服务器,ASIC 厂商的低毛利率意味着,同等规模的资本支出可采购更多服务器及芯片。以本章前文假设为例:ASIC 厂商毛利率为 50%,而英伟达毛利率为 70%,则数据中心资本支出可减少约 16%;若资本支出规模不变,可采购的机柜、服务器和芯片数量将增加约 19%。同理,若 ASIC 由联发科、世芯电子(未覆盖)等亚洲供应商提供(其毛利率低于 50%),或 GPU 由超威(AMD)、甚至英特尔等毛利率要求更低的厂商供应,晶圆代工厂、存储厂商、晶圆制造设备供应商等上游企业的价值获取将进一步提升。因此,上述上游厂商的价值占比(占数据中心资本支出的百分比),需根据采用这些供应商所带来的成本节省进行相应调整。
- 功耗效率增加了行业复杂性:若简单假设 GPU 与 ASIC 仅在厂商毛利率上存在差异、功耗效率一致,那么上述每吉瓦营收测算值不会发生变化。但实际情况更为复杂,GPU 与 ASIC 的功耗效率优化方向可能因应用场景不同而存在差异。
- 本测算是静态快照,行业格局仍将演变:我们认为,本次测算基于当前技术水平,未来将随技术迭代发生变化 —— 例如从 A100 到 B300 的演进趋势。本次分析以搭载 GB200 NVL72 的数据中心为样本,若要预测未来市场,需对测算结果进行调整。
- Lam集团称每 100 亿美元数据中心投资对应 80 亿美元设备机会,该如何解读?部分人士认为,我们测算的 “晶圆制造设备占数据中心资本支出 3-4%” 偏低,原因是泛林集团提出,每 100 亿美元数据中心投资对应 80 亿美元晶圆制造设备支出。我们认为,差异的核心原因在于泛林集团的数值,大概率基于英伟达、超威(AMD)和 ASIC 供应商芯片混合部署的数据中心场景;同时,其数值可能还包含了一些未来变化,而这些变化未体现在我们基于 GB200 NVL72 的分析中。我们还发现,若假设晶圆制造设备支出占 GPU 支出的 20%(GPU 占总支出的 40%),则泛林集团的测算值基本合理。这一 20% 的占比对于多数 ASIC 供应商而言基本适用,但对于英伟达而言偏高 —— 因其资本效率更高(反之,ASIC 在总支出中的占比通常低于 40%)。
机柜外设备
机电设备的支出分布相对分散,主要包括柴油和燃气发电机及涡轮机(占总支出的 6%)、不间断电源(UPS,占 4%)和变压器(占 5%)。热管理成本占比偏低(约 4%),且目前仍为风冷与液冷并存的格局,不过我们预计未来支出将持续向液冷倾斜。
- 备用柴油、燃气发电机及涡轮机是最大机电设备项,占总支出的 6%:这类设备的供应商包括卡特彼勒、MTU、科勒,以及 2025 年 4 月进入数据中心发电市场、并于 2025 年下半年启动国际交付的 Generac(未覆盖)。公用事业级发电设备不在本次分析范围内(因其不属于数据中心内部设备,相关成本体现在电费中),但目前已成为行业讨论的焦点。
- 配电设备总占比约 10%,供应商众多:配电设备厂商包括伊顿、施耐德电气、维谛技术、ABB、nVent和罗格朗等。电气设备搭载量的提升,是该领域企业的核心增长催化剂。伊顿约 20% 的营收来自数据中心和分布式 IT 业务:在传统数据中心中,伊顿每兆瓦算力的潜在销售额为 120-150 万美元,占计算和基础设施总资本支出的 6-10%;在 AI 数据中心中,这一机会将提升 50%,潜在销售额增至 120-290 万美元,占总资本支出的最高 8%。正因如此,伊顿目前正投资 15 亿美元,扩大三相不间断电源、高低压成套设备、配电盘和配电柜的产能,以满足数据中心不断增长的需求;同时,伊顿还通过并购(如收购 Fibrebond)重点布局模块化建造领域。电气组件厂商哈贝尔也通过收购 PCX 进入该市场。
- 热管理成本占比约 4%,相对偏低:目前热管理成本占总支出的约 4%,且风冷、液冷并存;但我们预计未来支出将持续向液冷转移。此外,维谛技术等行业玩家对该市场机会的预期,比我们的分析更为乐观 —— 维谛技术称,传统计算应用中,每兆瓦算力的热管理市场机会为 250-300 万美元,而在高密度计算应用中,这一数值将提升约 20%,至 300-350 万美元。
实际经济成本结构
服务器、网络设备等 IT 硬件的折旧年限,远短于机电设备或土地、建筑;且数据中心运营成本相对偏低,因此其实际经济成本中,服务器和网络设备的占比,可能远高于现金资本支出所体现的比例。即便电费高达 0.15 美元 / 千瓦时,1 吉瓦算力的数据中心年电费也仅约 13 亿美元;人力成本同样微乎其微 —— 据报道,数吉瓦算力规模的数据中心仅需 8-10 名员工,人均年薪 3-8 万美元。相比之下,即便按 6 年折旧周期计算(3),计算设备加网络设备的年折旧成本约为 34 亿美元。由于资本支出远高于持续运营成本,且硬件折旧年限短于实体基础设施,数据中心的实际总拥有成本(TCO)中,服务器和网络设备的占比,将远高于现金资本支出的占比。
事实上,GPU 并非使用 3 年后就完全报废;但在功耗成为核心瓶颈的背景下,继续耗费宝贵的电力和数据中心空间运行 5 年旧的 A100(250 瓦功耗对应 300 TFLOPS 单精度浮点运算能力)毫无意义 —— 毕竟新的 B200 仅需 1000 瓦功耗,就能实现 2500 TFLOPS 的单精度浮点运算能力。