网络管理 —警告系统的设计1 设计目标1. 数据采集:通过采集计算网络中的配置信息,告警信息,性能信息,反馈给告警中心
2. 数据分析:分析告警信息(原始告警信息,性能数据,配置信息),推理处理并存储记录告警,且实现告警的可确认消除(自动回复/ 手动恢复)
3. 数据应用:实时监控重要的告警信息,解决并消除告警信息
根据告警信息记录生成报表统计,向上层提供决策的数据依据
2 概要设计系统分三层: 数据的采集数据处理数据应用数据采集:从系统的网元上采集数据包括:性能数据信息,网元告警信息,拓扑结构的配置信息,向数据处理层的制定临时数据库中传送
数据处理:从指定的数据库中获得原始数据信息,判断处理
根据估值(及性能阀值)判断生成警告信息,存储分析并上报告警信息
实现告警的匹配确认清除,重复告警的归并处理
数据应用:及时监控重要的告警信息,并处理此告警,反馈告警的确认信息
根据不同的用户需求展现告警统计信息报表,为决策提供数据支持
3 数据采集层3
1 配置数据采集的内容及获得该网络中的网元设备,基本信息,与实体形成对应的映射
用于网络的拓扑信息管理
网管系统管理采集以下配置数据:3
2 告警数据采集的内容告警源需要采集的告警报告分为:网元告警路由器:交换机:配线板:服务器: cpu , 内存,硬盘,电源,风扇(散热) ,网卡,光驱,端口,运行的软件服务1. 环境告警 : 暂保留
2. 通信连接告警(拓扑管理) :当某一网元设备持续一定时间不响应网管系统时,网管系统应能自动生成该网元设备的通信连接警
3. 性能告警:当性能指标超出预先设定的范围时,系统触发的告警称为性能告警
4. 设备告警:来自设备红端的告警信息
原始告警数据内容原始告警数据是从告警源采集到的未经任何处理的原始告警信息,格式和内容与网元类型相关,原始告警信息将在告警管理应用层进行处理,采集层采