一、案例摘要
摘要:
(一)案例编写目的:
对流氓ONU的概念及处理方法有基本的了解
(二)主要内容:
流氓ONU的产生的故障现象、影响范围,处理该类型故障的主要手段
(三)达到效果:
对流氓ONU的产生、判断、处理方法有基本的了解
(四)基本结论:
PON口下存在长发光的流氓onu,会导致该PON口下其他onu无法上线。需要现场手工清除更换掉该ont后,pon口所有ont全部正常上线,问题解决。
二、关键词
关键词:流氓ONU;
三、案例正文
(一)案例背景
**北大分局华为0LT-3局点报障OLT 0/5/6 PON口下绝大多数ONU无法上线,现场更换分光器后,onu正常上线一会儿,约10分钟时间后故障再次出现,之后PON口下大量ONU全部处于离线状态。
(二)案例描述
处理过程:
查看PON口下onu状态,绝多数光猫均处于离线状态,个别onu在线。
根据客户反馈的故障现象,怀疑PON口下存在流氓onu。查看pon口状态,系统检测显示pon口下存在****的流氓onu,且查看到onu最后一次下线原因为LOSi。如下:
TO-BeiDa3(config-if-gpon-0/5)#display port state 6
----------------------------------------------------------------------------
F/S/P 0/5/6
Optical Module status Online
Port state Online
xPON MAC chipset state Normal
Low time lapse -
Last down cause -
Last up time 2019-04-17 18:01:32+08:00
TX power(dBm) 4.81
Illegal rogue ONU Existent //显示存在流氓onu
Max rate(Kbps) 1300000
Max Distance(Km) 20
Wave length(nm) 1490
Fiber type Single Mode
Signal detect Normal
TX fault Normal
Identifier SFP
选取某个ONU,查看它最后一次离线原因为LOSi。
TO-BeiDa3(config)# display onu info 0 5 6 8
-----------------------------------------------------------------------------
F/S/P : 0/5/6
ONU-ID : 8
Conurol flag : active
Run state : online
Config state : normal
Match state : mismatch
Last down cause : LOSi
进入单板模式,将该PON口0/5/6下所有onu全部deactivate,然后逐个逐个执行onu active操作,故障依旧,所有onu均无法激活。
全局模式下执行命令anti-rogueonu autodetect on 打开系统自动隔离检测到的流氓ONU功能开关。几分钟后,设备显示alarm相关告警信息如下:
ALARM 919736 故障告警 警告 0x2e314022 硬件设备类 2019-04-17 18:42:47+08:00
告警名称 :ONU是流氓ONU
业务影响 :影响业务
参数信息 :机框号: 0, 槽位号: 5, 端口号: 6, ONU ID: 3
告警描述 :ONU光模块常发光,ONU是流氓ONU
告警原因 :ONU光模块常发光
修复建议 :(1)隔离ONU
(2)替换ONU
派人前往现场手工清除更换该流氓onu后,PON口下其他onu均陆续正常上线,用户业务恢复正常。此时设备alarm告警如下:
ALARM 919766 恢复告警 清除 0x2e324021 硬件设备类 2019-04-17 18:57:31+08:00
告警名称 :端口下的****流氓ONU已经被清除
业务影响 :不影响业务
参数信息 :机框号: 0, 槽位号: 5, 端口号: 6
告警描述 :端口下的****流氓ONU已经被清除
告警原因 :端口下****的流氓ONU已被替换
修复建议 :无需处理
执行命令anti-rogueonu autodetect off 关闭设备自动隔离检测到的onu功能开关。问题解决。
(三)分析总结
关于流氓onu问题,总结如下:
流氓onu定义:由于PON上行时分复用,每个ONU根据OLT分配的时间戳向上行方向发送数据包。当某个ONU在没有分配时间戳的时候发光的话,就会与其他ONU的发光信号发生冲突。我们把这种不按照分配的时间戳向上发送光信号的ONU 叫流氓ONU。
流氓ONU主要分为以下两种:
1).长发光流氓onu:onu一直在发光(任何时刻都在发光)。
2).乱发光流氓onu:在非OLT分配的时间戳内发光,可能是提前发光,或者是延迟关断等。
流氓ONU常见故障现象:
1).如果该ONU已上线,会导致同一PON口下其他某个ONU或者所有ONU下线(离线)或者大部分ONU频繁上下线。
2).如果该ONU未配置,会导致OLT设备下其他未配置的ONU无法正常自动发现。
流氓onu问题常见解决办法:
当怀疑PON口下存在流氓onu时,一般在PON口下将所有onu全部deactivate,然后逐个逐个active的方法往往并不能解决问题,现网常见的解决问题办法如下:
1).对于长发光流氓onu,处理起来比较简单,如上案例。一般采取在OLT设备上自动隔离检测流氓onu的方法。
命令为:anti-rogueonu autodetect on (OLT配置该命令后,系统检测到流氓ONU时,上报告警信息并将该流氓ONU设置为隔离状态。处于隔离状态的流氓ONU只能接收信息,不能发送数据。(命令使用限制条件:1、系统只能检测长发光的流氓ONU。2、对应PON口下的ONU必须全部要支持华为扩展PLOAM消息(GPON);或扩展OAM消息(EPON))。
2).对于乱发光流氓onu,需要通过现场手工逐个排查的方法来解决。
1). 现场在分光器处将分支光纤全部拔掉,然后一根光纤一根光纤的插。插入第一根分支光纤,onu正常上线后,再插入第二根分支光纤。依次进行,当插入某根分支光纤后,PON口下其他onu出现离线故障,证明该分支光纤有问题或者下挂onu是流氓onu。
2). 现场在分光器侧使用光功率计来测量onu的发送光功率,以此来判断流氓onu的存在。