IP-Trunk负载不均衡导致业务中断的处理建议
IP-Trunk是将多个链路层协议为HDLC的POS接口或Serial口捆绑到一起,形成一条逻辑上的数据链路,以提供更高的连接可靠性和更大的带宽,实现流量负载分担。
产品问题:上图中P-GW和Router1间建立了一个GRE隧道。Router1和Router2之间通过IP-Trunk互连。某次网络扩容后,LTE上网业务缓慢,打开网页慢。有可能是出现了丢包。
产品建议:故障排查:从P-GW上ping Router2,没有延迟和丢包;分别在Router2和Router1上针对P-GW的IP流量进行统计,发现丢包发生在Router2和Router1之间的链路上;在Router2和Router1上使用命令display interface brief查看流量统计,发现IP-Trunk的7个成员中,其中一个端口流量达到97%,属于流量拥塞,但其他6个成员端口流量只有40%~50%;怀疑是负载分担哈希算法与流量不匹配。查看IP-Trunk端口配置,默认为逐流哈希。
分析:LTE流量通过GRE隧道承载,因此流量的源和目的IP地址是GRE隧道的源和目的IP地址,所以Router1把此流量都哈希到同一个成员端口上,导致了流量拥塞。
处理建议:在Router1上的IP-Trunk端口下配置命令load-balance packet-all,修改负载分担为逐包方式使LTE流量分担到其他成员端口,业务恢复正常。IP-Trunk逐流负载分担只支持根据二元组<源IP、目的IP>哈希。在GRE隧道组网情况下,由于流量的源和目的IP地址是GRE隧道的源和目的IP地址,会导致IP-Trunk负载不均衡,建议采用逐包方式。
@L晨曦 麻烦关注