智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


我们正在进入一个算力即服务(CaaS)的时代。云端训练、边缘推理、工业控制、金融交易……每一类业务对网络的要求截然不同,但有一个指标是所有高价值业务的共同底线——端到端时延的确定性。
然而,现实的网络环境却恰恰相反。
传统IP网络基于统计复用和分组交换,本质上是一个“尽力而为”的系统。在低负载时,它表现得足够好;一旦流量突发、微突发或出现微爆现象,队列缓存的压力会瞬间传导为丢包、重传、时延抖动。
对于普通上网、视频播放,这种不确定性可以容忍。但对于算力协同、异地双活、高频交易、继电保护——一次丢包意味着毫秒级的“空白窗口”,足以造成业务中断或经济损失。
这正是OTN(光传送网)重新进入视野的根本原因。它不是新技术,但在算力时代,它的刚性管道和光电联动调度能力,被赋予了新的使命:为算力网络提供一条“确定性底座”。
很多人认为:只要带宽足够大,就不会拥塞。这个观点在算力网络面前正在失效。
原因有三:
结论很清晰:带宽不能解决所有问题,关键在于“隔离”与“确定性”。
简单说,OTN通过时分复用(TDM)方式,将一个光纤的带宽划分为多个固定时隙的ODUk(Optical Channel Data Unit-k)通道。每个通道的带宽是独占的、物理隔离的。
与传统分组网络的区别:
有人会说:我在IP网上打上高优先级标记(DSCP EF),再用流量整形,不也能保证关键业务吗?
区别在于:QoS仍然在一个共享队列中运作。极端拥塞时,即使高优先级队列,也会因为队列缓存满而丢包(尽管概率低)。而OTN硬管道不存在“队列满”这个概念,因为根本没有其它业务竞争这个时隙。
打个比方:
OTN支持高阶(HO)和低阶(LO)ODU的复用结构。ODUflex可以根据业务需求,以1.25Gbps为粒度动态调整带宽(通过GMP映射)。当一个算力任务需要临时增加带宽时,控制平面可以发起带宽调整,业务无损。
光电联动更重要的价值在保护倒换。
传统保护(如MSP、SNCP)在电层完成,倒换时间一般在50ms以内。但在极端情况下(如光纤切断),OTN配合光层OXC(全光交叉)可以实现波长级的毫秒甚至亚毫秒级重路由。光层先完成路径切换,电层再做精细化适配,两者联动,业务几乎无感知。
这种机制带来的结果是:既保留了硬管道的零丢包特性,又具备了接近分组交换的灵活性和生存性。
高频交易策略对网络的要求极其苛刻:不仅要求低时延,更要求极低且稳定的抖动。
任何一次由于网络拥塞造成的微突发延迟,都可能导致交易指令错过最佳窗口。
在OTN组网的交易网络中,行情数据和订单指令跑在独立的ODU管道内,与办公网、行情分发网、互联网完全隔离。实测端到端时延的峰峰值抖动可以控制在±1微秒以内。这是任何分组网络(即使使用RoCE或Infiniband)都难以在长距离上实现的。
智能电网中的相量测量单元(PMU)、广域监测系统(WAMS)、稳控切机指令,要求端到端时延不超过10-50毫秒,且必须保证零丢包。
一次丢包可能造成保护装置拒动或误动。
OTN的硬管道被国家电网、南方电网广泛用于骨干和区域稳控通道。继电保护信号直接映射到ODU0(约1.25Gbps)通道,不经过任何分组封装,实现了物理层级别的透明传输和确定性时延。
“东数西算”工程中,东部实时业务(如自动驾驶训练数据预处理)需要调用西部算力。问题在于:数千公里的长距传输中,传统IP网络受限于链路质量波动和中间设备缓存,时延无法保证。
OTN的刚性管道可以提供端到端的确定性时延(每公里约5微秒,加上设备固定处理时延)。更重要的是,多个算力任务之间不会互相干扰——西部算力节点到东部客户端的路径,如同一条“租赁专线”。
目前,主流运营商已经在国家算力枢纽之间部署了OTN骨干平面,并在此基础上增加SRv6和算力感知能力,形成“OTN硬管道 + IP软切片”的融合底座。
有一种声音认为:OTN是传统TDM技术,会被全分组化替代。
这个观点忽视了物理隔离和确定性时延在关键业务中的不可替代性。
实际上,合理的架构是:
用一句话概括:IP解决连接灵活性的问题,OTN解决确定性承诺的问题。
算力网络正在从概念走向实践。在这个过程中,网络最深刻的变革将不再是“更快”,而是更确定。
OTN提供的刚性管道 + 光电联动调度,本质上是在一个共享的物理基础设施上,为关键业务构建了独占的、可承诺的逻辑平行宇宙。在这个宇宙里,没有丢包、没有拥塞、没有不可控的抖动。
这不是锦上添花,而是算力时代高价值业务的基础设施底线。
当金融交易、电网稳控、远程手术、自动驾驶的远程接管都依赖于网络时,我们不能再说“99.9%的可靠性”——那个0.1%的尾部延迟事件,就是事故。
确定性,才是新基建该有的样子。
