产品行业: 公共事业军团(L1)-公共安全(L2) 产品型号: CE6857F-48T6CQ 背景叙述: 我们这边CE6857F主要是做IDC服务器接入交换机,一台下面挂几十台机器。平时还算稳定,但偶尔业务高峰会出现某些服务器间歇性丢包或访问变慢,服务器本身CPU、内存、网卡都正常,链路也没有down。 产品问题: 排查时发现接口一直UP,也没有告警,但CRC error在慢慢增长,光模块功率也有轻微变化。这类问题的特点是“设备看起来正常,但实际上链路已经在变差”,只能靠人工去翻接口统计和历史对比,比较依赖经验,也容易延迟发现问题。 产品建议: 希望能增加端口健康趋势提示,比如CRC持续增长、光功率异常波动时给个风险提示,或者提供一个端口健康度视图,让这种“没到故障但已经在变差”的情况能提前被看到。