智算多多



2026年4月3日,由中国电信广东公司与阿里云智能集团联合打造的粤港澳大湾区首个基于“真武”芯片的万卡智算集群,在韶关数据中心集群正式上线,这是国家“超大规模智算集群”新基建在粤港澳大湾区的首个落地项目。
“真武”万卡智算集群在技术层面实现了多项关键突破。集群采用新一代高性能组网架构,端到端数据传输时延低至4微秒,网络峰值利用率超过95%,上万张芯片得以像一台超级计算机一样协同工作,稳定承载千亿参数级大模型的训练与推理任务。单机性能同样突出——单台“真武”服务器配备1.5T超大显存,卡间互联带宽700GB/s,Qwen3.5、DeepSeek V3.2全参数版等主流开源大模型均可在单机上直接部署运行。在开发生态层面,“真武”芯片已全面适配主流AI框架与工具链,并提供统一编程接口,开发者无需重写代码即可将已有业务平滑迁移至国内算力平台。
在此基础上,集群提供了从IaaS、PaaS到MaaS的全栈AI云能力,用户既可以用它训练自己的专属模型,也可以直接调用已有的大模型能力。得益于针对“真武”芯片深度优化的工具套件,模型运行环境可在秒级完成加载,单个模型的微调最快数小时即可完成,整体训练与推理效率较通用方案提升超过30%。这种“开箱即用”的模式,让用户无需受困于底层建设与反复调参。
2026年4月3日,由中国电信联合阿里云建设的广东首个“真武”万卡智算集群在韶关数据中心上线。
当天,集群发布活动在韶关数据中心集群浈江产业园中国电信粤港澳大湾区智能算力中心举行。
作为国家“超大规模智算集群”新基建在粤港澳大湾区的首个落地项目,该集群覆盖了从芯片、云平台到模型应用的关键环节,有助于自研算力技术的产业应用。
集群采用新一代高性能组网架构,通过卡间RoCE高性能组网、双平面多轨通信等技术,实现端到端网络时延为4微秒,网络峰值利用率超过95%,能够满足大模型训练过程中AllReduce、AlltoAll等通信需求,可用于千亿参数级大模型的预训练与推理任务。真武芯片整机提供1.5T显存,卡间互联带宽超过700GB/s,为国产算力底座提供支持;Qwen3.5、DeepSeek V3.2全参数版等开源大模型可在单机上部署运行。
真武芯片适配主流AI生态,其软件栈适配各类主流模型、框架、算子库及操作系统,具备统一的编程接口,可支持用户业务落地与扩展,降低迁移成本。
集群提供IaaS、PaaS、MaaS全栈AI智算云化产品服务,支持多机训练、单机与多机推理、基础模型一体机等多种交付形态;基于真武芯片提供训练推理优化套件,支持镜像加载与模型调优,支持训练与推理效率的提升,实现快速部署。
“真武”万卡智算集群面向政务治理、医疗民生、新兴产业等领域提供算力及应用解决方案。
在政务治理领域,该集群为城市管理与公共安全等场景提供算力底座及“超级搜图”应用,用于提升海量图片与视频数据的检索效率。
在医疗民生领域,集群上线“全诊通”应用,面向基层医疗机构提供诊疗智能化服务,并在中山大学肿瘤防治中心等医院开展国产化迁移与应用试点。
在产业创新领域,集群为电子信息、先进材料、生物医药、装备制造、低空经济等新兴产业提供模型训练、推理与调优服务,为企业提供研发迭代与智能化升级相关的算力支持。
算力普惠是该集群上线的目标之一。该集群采用全栈自研和深度协同技术,据称其单卡吞吐性能与每秒Token生成总量较传统单机部署模式有所提升,每百万Token的算力成本有所下降。集群支持DeepSeek-V3.2、Qwen3.5-397A-A17b等开源模型的部署。
在生态兼容方面,“真武”芯片支持主流AI生态,具备统一的编程接口,可支持用户业务落地与扩展,有助于降低迁移成本。此外,集群资源通过集约运营,面向中小企业提供算力服务。
该智算集群计划在未来进行扩容,并计划建设服务于关键行业领域的智能算力服务平台,以支持粤港澳大湾区相关机构使用算力资源。
具体举措包括持续强化技术引领,攻关算网协同调度、软硬一体优化、智算网络架构等关键技术;深化应用赋能,面向政务、制造、医疗等重点行业,推出算力、模型、数据与应用结合的解决方案;坚持开放共享,与产学研用各方共建创新联合体;践行绿色发展,建设绿色数据中心。同时,集群资源将接入算力服务平台,推动算力服务化。长远目标是扩大智算规模、降低算力成本、完善产业生态,建设服务于华南地区的算力中心,促进大模型能力在多个行业中的应用。