网络中遇到“雷暴”,如何让核心网信令风暴的雪球越滚越小?
悬赏100智豆对于告警,我觉得可以用类似发泡算法,小告警遇见大告警,就只留大告警。
基站上面,华为设备从GSM开始就有信令风暴抑制机制了。
4G: S1接口重建定时器参数。该功能主要目的是为了避免MME在多个eNodeB的S1同时向其发起S1建立流程时因大流量信令(风暴)而宕机或异常。具体做法是eNodeB在S1 setup failure之后,在定时器时长最小值和最大值范围内随机取一个时间,以此时间作为间隔,再次发起S1 setup过程。
5G: NG随机重建开关,该参数表示是否开启NG接口随机重建功能。如果打开,gNodeB在收到NG setup failure消息且消息中未携带重试时间,或者gNodeB等待NG接口建立响应超时,则gNodeB在3分钟内随机选取一个时间再次发起NG setup过程,避免AMF在多个gNodeB同时向其发起NG建立流程时因大流量信令(风暴)而异常。
赞赏


消息区分优先级和发生事件、持续时长,根据这些信息分批次推送到不同节点。
要让网络异常恢复后的“雪球”越滚越小,最终达到自愈的效果,可以从以下几个方面着手:
1. 加强网络基础设施的健壮性和冗余性
- 提升网络设备的抗震、抗灾能力,减少自然灾害如地震等对网络基础设施的破坏。例如,可以采用更加坚固的通信设备、建设冗余的数据中心和通信线路,以确保在部分设施受损时,网络仍能保持连通。
- 定期对网络设备进行维护和升级,及时更换老化或存在隐患的设备,降低技术故障的发生概率。
2. 建立完善的应急响应机制
- 制定详细的网络中断应急预案,明确在发生网络中断时的应对措施、责任人和恢复流程。
- 加强监控和预警能力,及时发现网络异常并启动应急响应机制,快速定位故障点并进行抢修。
3. 优化网络流量管理
- 在网络设计中考虑流量控制和拥塞避免机制,如使用流量整形、队列管理等技术,确保在网络恢复后能够有序地处理积攒的消息,避免“火山爆发”式的流量冲击。
- 对于智能终端的自动尝试连接行为,可以通过设置合理的重试间隔、限制重试次数等方式进行管控,减少不必要的网络负担。
4. 提升网络恢复能力
- 采用快速恢复技术,如备份网络设备、服务器参数和系统配置,以便在故障发生时能够迅速切换至备用设备,缩短恢复时间。
- 加强与技术供应商、维护商等的合作,确保在发生故障时能够及时获得技术支持和维修服务,加速网络恢复进程。
5. 加强网络安全防护
- 提升网络安全意识,加强网络攻击防范和应对能力,减少因网络攻击导致的网络中断和流量异常。
- 定期对网络进行安全漏洞扫描和修复,确保网络系统的安全性。
通过以上措施的实施,可以逐步减少网络异常恢复后的“雪球”效应,提高网络的自愈能力,确保网络的稳定运行。
- 1
- 2