网络故障管理系统告警相关性分析研究
Network Fault Management System Alarm Correlation Analysis and Research
故障管理是网络管理中最基本的功能之一,当网络中发生了故障以后,如何尽快判断故障的原因、性质和发生地点,是排除故障的关键前提.告警的大数据量问题是影响网管性能和系统稳定性的关键问题,因此,实现告警相关性分析是网络故障管理系统的一个重要和基本要求.该文在简要介绍规则引擎技术的基础上,分析了基于规则引擎的网络故障管理系统体系结构及故障的处理流程,给出了采用SNMP协议进行告警数据采集的处理流程.规则引擎的核心是高效的Rete模式匹配算法,该文从存储空间大小、添加一个工作内存元素的开销以及删除一个工作内存元素三个方面对Rete算法进行了研究和分析,并用实例分析了Rete算法鉴别网络生成过程及其匹配过程.在此基础上,该文从删除事实和取消标牌栈两方面提出了对Rete算法的改进措施.经过对改进后的Rete算法的效率进行分析,得出改进后的Rete算法不仅不影响Rete算法的性能,反而会加速Rete算法,提高了算法的效率,节省了空间开销.告警相关性分析是网络故障管理系统中一个非常重要的功能模块.该文在Eclipse平台上以Java语言为开发工具,采用Drools规则引擎技术设计与实现了网络故障管理系统中的告警相关性分析.在告警相关性分析的实现过程中,首先根据不同的规则制定相应的业务模型和规则模型,然后给出了相关性规则的获取方法和规则库的存储方法,并给出了相关性规则引擎的实现过程,最后给出了告警相关性分析及故障定位和诊断的具体实现过程.
- 作者:
- 王威
- 学位授予单位:
- 沈阳理工大学
- 专业名称:
- 计算机应用技术
- 授予学位:
- 硕士
- 学位年度:
- 2009年
- 导师姓名:
- 马秀丽
- 中图分类号:
- TP393.07
- 关键词:
- 网络故障管理;业务规则引擎;Drools;Rete算法;告警相关性分析
- Network fault management;Business rule engine;Drools;Rete algorithm;Alarm correlation analysis