产品行业: ISP与互联网系统部(L1)-通信(L2) 产品型号: NetEngine40E&80E 背景叙述: Router ID 是一个 32 位的无符号整数,用于唯一标识 OSPF 网络中的每个路由器。在 OSPF 的操作中,Router ID 扮演着类似 IP 地址的角色,但它并不直接参与数据包的转发,而是用于 OSPF 路由协议内部的识别和管理。Router ID 的唯一性保证了在 OSPF 网络中,每个路由器都能被唯一识别,从而避免路由冲突和环路的发生。 产品问题: 下图网络拓扑中,本地CE1和CE2设备PING本地直连PE都正常,但是PING远端的CE和业务IP会出现偶尔不规则的丢包。 [图片]https://jdc100.huawei.com/CommunityGatewayService/com.huawei.ipd.sppm.jdcforum:JDCCommunityUserService/CommunityUserService/jdc/api/attachment/downLoadByAid?path=202504/24/1524150e6370f4-3c22-4626-aa4b-93d96f19f9f0.png&aid=964521&bussinessType=2&tid=1141453[图片] PE和CE之间运行OSPF多实例,CE为其他厂商的三层交换机,PE下发OSPF缺省路由引导两地业务的互通。PE1和PE2都有另外一个接口连接到同一台UMG设备,并且两台PE上连接UMG的两个接口IP都配置为10.1.1.33,并且绑定到了上面的VPN实例中。正常情况下由于UMG到备用PE2的接口不发光,所以两台PE上关于10.1.1.33的接口不会同时UP。 产品建议: 故障分析过程如下: 由于在两边PE绑定的VPN实例中,10.1.1.33为最大的一个IP地址。并且OSPF多实例的配置为: ospf 4 vpn-instance www 所以导致PE1、PE2的OSPF进程4都选择10.1.1.33为Router-ID。 在CE1、CE2上查看两边PE的Router-ID都为10.1.1.33。 在CE上查看debug相关信息后发现,Router-ID为10.1.1.33的设备不断发送LSA,频率为5秒一次,而且seq值递增,不稳定。 CE交换机均收到相同Router-ID的两台设备发送的LSA,所以查看路由表看到的OSPF缺省路由信息就会不断变动。而当CE1的缺省路由从CE2中学到,CE2的缺省路由又从CE1中学到时,就形成了路由环路,因此出现路由不可达,造成丢包。 建议按如下步骤进行操作: 在两台PE上分别执行命令,强制指定该OSPF多实例的Router-ID为PE本机上唯一的地址。 [PE1] ospf 4 router-id 10.2.2.9 vpn-instance www [PE2] ospf 4 router-id 10.2.2.10 vpn-instance www 重启两台PE上设备该VPN实例的OSPF进程,业务恢复。