IP-Trunk负载不均衡导致业务中断的处理建议

wanglanling·
作者
占位图片
medal
电信运营商
擅长领域擅长领域:数据中心网络
产品行业:

ISP与互联网系统部(L1)-通信(L2)

产品型号:

NetEngine40E&80E

背景叙述:

IP-Trunk是将多个链路层协议为HDLC的POS接口或Serial口捆绑到一起,形成一条逻辑上的数据链路,以提供更高的连接可靠性和更大的带宽,实现流量负载分担。

产品问题:

上图中P-GW和Router1间建立了一个GRE隧道。Router1和Router2之间通过IP-Trunk互连。某次网络扩容后,LTE上网业务缓慢,打开网页慢。有可能是出现了丢包。

产品建议:

故障排查:从P-GW上ping Router2,没有延迟和丢包;分别在Router2和Router1上针对P-GW的IP流量进行统计,发现丢包发生在Router2和Router1之间的链路上;在Router2和Router1上使用命令display interface brief查看流量统计,发现IP-Trunk的7个成员中,其中一个端口流量达到97%,属于流量拥塞,但其他6个成员端口流量只有40%~50%;怀疑是负载分担哈希算法与流量不匹配。查看IP-Trunk端口配置,默认为逐流哈希。

分析:LTE流量通过GRE隧道承载,因此流量的源和目的IP地址是GRE隧道的源和目的IP地址,所以Router1把此流量都哈希到同一个成员端口上,导致了流量拥塞。

处理建议:在Router1上的IP-Trunk端口下配置命令load-balance packet-all,修改负载分担为逐包方式使LTE流量分担到其他成员端口,业务恢复正常。IP-Trunk逐流负载分担只支持根据二元组<源IP、目的IP>哈希。在GRE隧道组网情况下,由于流量的源和目的IP地址是GRE隧道的源和目的IP地址,会导致IP-Trunk负载不均衡,建议采用逐包方式。

赞同 赞同不赞同 不赞同围观 围观