智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


英伟达虽未单独亮相MWC26,但其身影遍及场内外各个角落。本届巴塞罗那通信展将人工智能置于前所未有的地位,AI-RAN成为最热话题方向之一,并被解读为“电信产业链权力重构的分水岭时刻”。
MWC26传递出明确信息:AI-RAN已从单纯演示阶段迈向概念验证(PoC)与初步部署阶段。AI-RAN并非单一技术,而是一场复杂的利益博弈。
英伟达参与MWC26期间超过90个演示。其在3月GTC大会提出的“AI Grid”愿景,核心是利用电信运营商、云服务提供商等现有网络覆盖,将AI计算能力(特别是推理能力)部署至更靠近用户和设备的边缘位置,以支持AI原生应用的大规模、低延迟扩展。
英伟达目标是将触角延伸至电信网络每个边缘节点。自2024年成立AI-RAN联盟,到2025年斥资10亿美元投资诺基亚,其路径清晰:将无线接入网(RAN)从连接管道改造为分布式AI推理工厂。
英伟达将AI-RAN与AI Grid定位为构建6G网络及新型服务的核心基石。AI-RAN是AI Grid的核心组件之一,充当边缘网络和计算层,实现RAN操作与AI处理融合;AI Grid作为赋能平台,提供分布式云和编排层,使AI-RAN高效扩展,创造软件定义环境,允许多种AI工作负载共存并共享GPU基础设施,且不影响网络服务质量。
市场研究公司ABI Research高级研究总监Dimitris Mavrakis指出,英伟达推动AI Grid这一系统级方案的深层动因,在于倒逼电信运营商采取实质性行动,在AI超级周期中抢占先机、确立自身地位。
通信网络架构正经历向“以计算为中心”的范式转型,RAN将被深度整合进更广泛的分布式云基础设施,其架构模式日益趋同于超大规模基础设施服务提供商(Hyperscalers)所采用模式。
美国运营商T-Mobile与英伟达近期合作演示中,英伟达AI-RAN产品组合包括基于RTX PRO 4500 Blackwell服务器构建的ARC-Pro,用于蜂窝站点;以及RTX PRO 6000 Blackwell服务器,用于更高容量移动交换局。该合作展示了下一代AI-RAN基础设施如何将无线网络转为分布式高性能边缘AI计算平台。
日本运营商软银在MWC26发布电信AI云平台(Telco AI Cloud),同时支持AI模型训练与推理,通过将GPU部署于更靠近用户位置满足低时延类应用需求;并宣布开源Aitras编排器,便于RAN厂商与运营商实现AI-RAN编排,加速商用部署,扩大生态。
市场研究公司Omdia移动基础设施研究负责人Remy Pascal表示,基于英伟达的RAN平台尚未做好规模化部署准备,目前大多数运营商仍将其视为下一代网络选项,首个商用部署解决方案预计2027年上市。
Remy Pascal分析指出,推动AI-for-RAN——即在RAN(基带、射频和管理层)中运行AI以提升性能、效率并实现部分操作自动化——已基本达成共识;争议焦点在于AI-and-RAN是否应运行于同一计算平台,以及该平台是否应基于GPU。各类演示证实AI与RAN工作负载可在共享基础设施上共存,无论GPU或CPU平台,但不同平台在性能、容量、效率、功耗、总拥有成本(TCO)等方面并不对等。
面对英伟达强势推进,全球主流设备商选择差异化战略路径,MWC26凸显三条技术路线:
中国厂商受地缘政治影响无法自由使用英伟达高端GPU,但通过深耕自研专用芯片及持续优化通信专用AI大模型,中国市场在TM Forum自智网络AN L4认证方面处于全球领先地位,证明不依赖单一GPU生态亦可实现高阶自智网络与AI原生特性。
Dimitris Mavrakis认为,西方厂商可能逐渐向英伟达方案靠拢,但在高阶MIMO等先进射频技术部署中仍需定制芯片;且因能耗是6G主要制约因素,ASIC在密集场景具结构性优势,长期看异构架构(GPU+ASIC)更可行。其预期最大里程碑是诺基亚成功将基带软件移植至CUDA架构并推出基于GPU硬件单元,与Reefshark系列产品并行运作;一旦证明CUDA实现效率可媲美定制芯片,更多西方厂商或将跟进。
Remy Pascal表示,未来不同厂商、策略与计算平台将共存,单一平台不会一统市场;不少厂商正观望,亦有厂商在信道估算、链路自适应等复杂RAN任务中以AI模型替代传统算法,策略务实:在有明显回报处用AI,优势不明确处继续沿用传统方法。
关于6G互操作性危机风险,两位分析师均持否定观点,强调3GPP专注于定义框架与接口,在框架内提供足够灵活性以适配不同RAN实现方式,同时保持全球标准与互操作性。
英伟达AI-RAN愿景之一是助运营商抓住“Token经济”新机遇,提出“Token提供商”概念——运营商利用边缘网络为AI大模型提供推理服务(Token生成),从管道商转型为AI算力服务商。
Dimitris Mavrakis强调,AI-RAN与Cloud RAN、vRAN、Open RAN有本质区别:英特尔曾借x86与FlexRAN主导前两者,目标为提升运营效率并降低成本;而英伟达AI-RAN定位非仅“降本工具”,而是助运营商优化业务运营并开辟新增收点。
新加坡工程院院士Tony Quek教授指出,未来通信交互主体将由“人”转向“机器人”或“平台”,交互信息不再是简单数据而是“智慧”,智慧易于从模型获取,运营商可通过Token化实现增值,此为技术变革亦为商业模式重塑。
中国电信总经理刘桂清在2025年业绩说明会上表示,智能时代须加快从“流量经营”向“Token经营”转型,Token服务将成为今后经营主线。
Dimitris Mavrakis提出,运营商可在机器人技术或物理AI等低延迟要求极高场景中,将自身重塑为Token提供商,商业回报或优于传统移动宽带业务。
然而,Token经济带来商业模式重塑诱惑的同时,AI-RAN亦可能引发更深层次新型“锁定”。长期以来运营商面临“厂商锁定”效应,最初存在于设备商之间,后转移至英特尔,未来极可能转移至英伟达。
Dimitris Mavrakis分析,若爱立信和诺基亚将其软件平台移植至CUDA架构,则英伟达形成的厂商锁定效应将远强于其他公司;鉴于电信网络“运营商级”特性,其或不适用开放市场运作模式,竞争重心或将转移至软件层面;这意味着运营商在底层服务器选择上或有更多余地,但仍被锁定于英伟达生态体系;其最重要战略转变或在于牢牢掌控网络架构上层部分(业务编排、数据管理及服务开放),而非仅追求硬件供应商多元化。
Remy Pascal对AI-RAN时代供应商锁定关系持乐观态度,认为多数运营商希望推行多供应商策略以避免锁定,该策略在专用RAN及通用计算RAN中均可能实现;运营商选择供应商始终存在锁定风险,但当前风险未必高于过去,亦未必某家供应商风险更高。
所有技术争论最终回归财务报表。电信运营商面临严峻财务现实:与豪掷千金的Hyperscalers相比,其资本支出能力相形见绌;Hyperscalers可为AI霸权不计成本投入,而运营商必须精打细算每一笔TCO。
Dimitris Mavrakis认为,AI-RAN在短期内可能无法降低运营支出(OPEX),甚至可能导致OPEX增加。
英特尔在算力架构转型中并未放弃。其执行副总裁兼数据中心事业部总经理Kevork Kechichian指出,应拒绝CPU与GPU二元对立,主张为不同AI工作负载匹配合适算力,以平衡性能、效率、成本与部署便捷性。英特尔至强6 SoC集成AMX与vRAN Boost,将AI推理集成至vRAN软件栈,无需额外GPU即可完成多数推理任务;已与沃达丰、乐天移动、SK电讯、NTT DOCOMO等多家运营商合作,验证低TCO、高利旧、易运维优势。
Remy Pascal表示,不能简单认为GPU必然推高网络成本。“GPU本质上更昂贵、更耗电”属过度简化看法;评估GPU须考虑每比特成本与功耗、利用率及芯片更广泛能力;运营商应全局考量并自行测算,确保收益大于相关成本,包括运营效率、可扩展性及生命周期价值等多重因素。
当前正值3GPP定义6G标准关键窗口期。通往6G道路上,GPU通用性与ASIC能效性、英伟达生态霸权与运营商独立诉求,将长期处于动态平衡与博弈之中。
运营商既是最大金主,亦是最焦虑群体:渴望通过AI-RAN转型为Token提供商打破营收天花板,又警惕沦为芯片巨头电力供应商。
Tony Quek教授指出,未来6G通信主权不仅关乎频谱资源掌控,更体现于智能架构信创生态构建;全球加剧的地缘政治风险正促使不同区域考量建立自主可控产业体系。
尽管投资能力不及Hyperscalers,但在AI时代,电信运营商将是隐形关键基础设施提供商。RAN是连接物理世界与数字世界最后一公里,对国家安全至关重要。运营商需利用遍布全国的边缘节点,为国家AI战略提供底层算力支持。因此,未来AI-RAN发展很可能不仅是纯粹市场选择,更是商业利益与国家战略混合体。
