产品行业: ISP与传媒军团(L1)-通信(L2) 产品型号: OptiXtrans DC908 背景叙述: 当前AIDC(智算中心)建设正从单集群向“多DC协同训练”演进。在实际承载如GPT类大模型训练业务时,东西向流量呈现突发性强、对微突发时延极度敏感的特征。目前我们在使用DC908进行DCI互联时,虽然物理带宽足够,但在面对AI训练任务(如参数同步阶段)的微突发流量时,缺乏针对应用层的精细化感知与调度机制。同时,在跨域(多机房)业务开通时,仍依赖人工逐段配置波长与OTN通道,耗时较长,难以匹配AI业务“分钟级”上线的敏捷需求。 产品问题: 1.时延抖动感知不足:现有网管对业务时延的监控多为平均值,难以捕捉到微秒级的微突发拥塞,导致AI训练任务偶发“长尾时延”,影响训练效率(MFU)。业务开通自动化程度低:在进行跨DC的大带宽(如400GE/800GE)专线开通时,缺乏端到端的“意图驱动”配置。运维人员需在网管上手动规划路由、分配波长和时隙,跨域协调复杂,容易因人工配置错误导致业务不通或性能非最优。 产品建议: 建议在未来的版本或iMaster NCE控制器联动中,重点增强以下两点能力:引入“AI流量感知的动态时延优化”功能:建议利用Telemetry技术,将时延采集粒度提升至微秒级。当检测到特定业务流(如RDMA流量)出现微突发拥塞时,设备能自动触发缓冲优化策略或动态调整队列调度权重,优先保障训练流量的低时延转发。实现“跨域业务意图驱动的一键发放”:希望DC908能深度适配iMaster NCE的意图网络引擎。运维人员只需在界面上声明“带宽需求=400G,SLA=低时延,路径=DC_A到DC_B”,系统即可自动计算最优光路(考虑OSNR、时延等物理损伤),自动完成波长路由规划与下发,实现“零接触”开通,将业务上线周期从天级缩短至分钟级。