智算多多



2025年6月,NVIDIA ConnectX-8 SuperNIC固件版本40.45.1202初始发布。2025年8月26日,英伟达正式发布了专为Blackwell架构和加速超大规模AI工作负载而设计的ConnectX-8 SuperNIC。在COMPUTEX 2025展会上,ConnectX-8 SuperNIC被宣布用于全球系统合作伙伴的NVIDIA RTX PRO服务器中,并已全面投产,同时,ConnectX-8 SuperNIC已集成到NVIDIA HGX B300和NVIDIA GB300 NVL72系统中,例如华硕在Computex 2025上发布了采用NVIDIA ConnectX-8 SuperNIC的ESC8000系列AI服务器。在2025年8月25日/26日举行的Hot Chips 2025会议上,NVIDIA介绍了ConnectX-8 SuperNIC。
NVIDIA ConnectX-8 SuperNIC是一款在单个设备中集成PCIe 6.0交换机和800Gb/s网络的智能网卡(SuperNIC)。
该产品支持AI推理和训练工作负载,提供GPU间高速连接。其硬件包括集成PCIe 6.0交换机,提供最多48通道的PCIe Gen6连接,以及一个16核16线程RISC-V数据路径加速器(具有16核16线程RISC-V事件处理器)用于硬件加速。
通过将PCIe交换和网络集成,该设计提升了每个GPU的网络带宽。在特定配置下,可为每个GPU提供50 GB/s的I/O带宽(基于2:1的GPU到NIC比例,相当于为每个GPU提供400 Gb/s的网络带宽),并将NCCL all-to-all性能提升。相比传统OTSRDMA方案,该产品可缩短AI训练步长时间,并降低尾部延迟。该设计也简化了主板布局,减少了元器件数量。这种集成设计有助于简化系统布局。
ConnectX-8 SuperNIC支持Spectrum-X以太网和Quantum-X InfiniBand硅光网络交换机,其集成的Spectrum-X以太网功能可扩展到八个端口,并通过多平面交换架构实现将GPU集群规模扩展到128000个,其硬件管线为800G RDMA。该硬件管线内置负载均衡、拥塞控制与可靠性机制。
ConnectX-8 SuperNIC的核心技术包括提供高达800 Gb/s的InfiniBand XDR接口和2×400 Gb/s的Spectrum-X以太网接口,支持AI推理和训练工作负载的双网络协议。其主机接口通过集成PCIe交换机提供PCIe Gen6 x48通道连接,并能扩展至64 GPU集群,其集成的ConnectX-8 RDMA可扩展操作系统服务,实现AI网络的高效通信。
在性能上,相比传统OTSRDMA网卡/交换机方案,ConnectX-8 SuperNIC有助于缩短AI训练步长时间,并保持较低的尾部延迟。通过优化负载均衡、噪声隔离等技术,在有效带宽和全归约带宽等方面有所提升。
ConnectX-8 SuperNIC的数据路径加速器(DPA)集成了16核16线程的RISC-V事件处理器,用于运行维护网络效率的算法,实现网络智能加速。此外,它还支持NVIDIA网络计算加速引擎,为万亿参数级AI工厂和科学计算工作负载提供所需性能。
ConnectX-8 SuperNIC现已全面投产,并集成于NVIDIA HGX B300和NVIDIA GB300 NVL72系统中。
在COMPUTEX 2025上,该产品由全球系统合作伙伴展示,用于搭载多颗NVIDIA RTX PRO 6000 Blackwell Server Edition GPU的NVIDIA RTX PRO服务器。
ConnectX-8 SuperNIC被集成到NVIDIA RTX PRO服务器中,支持MGX 6U和4U配置。NVIDIA ConnectX-8 SuperNIC PCIe Switch板卡集成多个SuperNIC,通过消除独立PCIe交换机、加倍GPU间带宽和简化主板设计,推进了RTX PRO服务器架构。
NVIDIA ConnectX-8 SuperNIC是一种为加速大规模AI与高性能计算工作负载而设计的网络组件。其提供800 Gb/s的网络带宽,适用于AI工厂、云数据中心环境以及科学计算工作负载的网络连接。性能方面,相比传统方案,可将AI训练步长时间缩短60%,并保持较低的尾延迟。此外,通过优化的多平面交换架构,其可支持将AI集群扩展到128000个GPU,以应对大规模部署中的可扩展性挑战。作为NVIDIA AI网络产品组合的一部分,ConnectX-8 SuperNIC可与Spectrum-X以太网交换机、Quantum-X InfiniBand交换机等网络平台集成,用于构建端到端的AI计算网络。该产品已投入生产,并被集成于NVIDIA RTX PRO服务器平台,华硕等系统制造商将其用于构建AI POD和服务器解决方案。该产品在单个设备中集成了PCIe 6.0交换机和网络功能,并已投入生产。在COMPUTEX 2025上,ConnectX-8被发布并集成于全球系统合作伙伴的NVIDIA RTX PRO服务器中,同时也与NVIDIA HGX B300和NVIDIA GB300 NVL72系统集成。通过集成PCIe交换机,ConnectX-8 SuperNIC有助于简化系统设计,并可能提升能效。具体而言,它将GPU到GPU和GPU到NIC通信整合到单一高性能设备中,消除了对独立PCIe交换机的需求,减少了元器件数量并简化了主板设计,有助于实现紧凑、节能且经济高效的平台设计,从而降低总体拥有成本(TCO)。此外,ConnectX-8 SuperNIC还可在基于多GPU的平台中实现增强的机密计算能力。
ConnectX-8 SuperNIC提供两种主要型号。型号C8180P的SKU为900-9X85E-00EX-MJ0,采用单端口OSFP连接器,默认支持InfiniBand 800Gb/s XDR速率和以太网2x400GbE速率,外形规格为OCP 3.0 TSFF,主机接口为PCIe 6.0 x16,支持多主机与Socket Direct扩展、加密加速和安全启动功能,采用内部锁扣支架和风冷散热,生命周期为原型阶段。型号C8180P Partner Cooled的SKU为900-9X85E-00EX-MP0,散热方式为合作伙伴散热,其余参数与C8180P相同。
ConnectX-8 SuperNIC采用单端口OSFP连接器,支持InfiniBand与以太网协议,最大总带宽为800 Gb/s。其支持的InfiniBand速率包括800、400、200和100 Gb/s,以太网速率支持400、200、100、50和25 Gb/s,并支持端口拆分功能。该产品遵循InfiniBand Architecture Specification(v1.2.1, 1.4, 1.5, 1.7)和IEEE Std 802.3等标准。
ConnectX-8 SuperNIC的主机接口为PCIe Gen6,最多支持48通道。其扩展能力支持NVIDIA Multi-Host™技术,最多可连接四个主机,并支持通过Socket Direct™辅助卡进行扩展。
在网络加速方面,ConnectX-8 SuperNIC支持RDMA over Converged Ethernet (RoCEv2)和加速交换与数据包处理(ASAP2),后者支持OVS加速、VXLAN/GENEVE/NVGRE等隧道封装、连接跟踪、NAT以及分层QoS。它还具备高级可编程拥塞控制功能。在计算与存储加速方面,支持NVIDIA® GPUDirect® RDMA和GPUDirect Storage。其网络内计算功能支持NVIDIA® Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™。MPI加速支持集合操作、增强原子操作和会合协议卸载等。软件支持方面,兼容NCCL, HPC-X, DOCA UCC/UCX, Open MPI, MVAPICH2等AI/HPC软件栈。
ConnectX-8 SuperNIC的平台安全功能包括安全启动、硬件信任根、安全固件更新和闪存加密。设备认证支持安全协议和数据模型(SPDM 1.1)。在线加密加速支持IPsec和MACsec加密/解密。
ConnectX-8 SuperNIC支持网络控制边带接口(NC-SI)进行带外管理。平台管理支持通过SMBus和PCIe的MCTP协议,遵循PLDM规范用于监控、控制、固件更新、Redfish设备启用和FRU信息。调试接口支持JTAG(IEEE 1149.1 & 1149.6)和SPI闪存接口。网络启动支持InfiniBand或以太网环境下的PXE启动、iSCSI启动和UEFI启动。
ConnectX-8 SuperNIC支持IEEE 1588v2精密时间协议,符合G.8273.2 Class C标准,并提供线速硬件时间戳。同步以太网功能符合G.8262.1标准。其他功能包括支持精确时间测量、可配置的每秒脉冲输入/输出、基于时间的触发调度以及基于PTP的数据包整形。
ConnectX-8 SuperNIC的外形规格符合OCP 3.0 TSFF规范,同时兼容标准卡式机电PCIe x16外形。散热设计提供风冷版和合作伙伴散热版。其互连需使用符合相应规范的高质量线缆与光模块,以满足高性能和极低误码率的要求。