网络管理—警告系统的设计 1 设计目标 1 . 数据采集:通过采集计算网络中的配置信息,告警信息,性能信息,反馈给告警中心。 2 . 数据分析:分析告警信息(原始告警信息,性能数据,配置信息),推理处理并存储记录告警,且实现告警的可确认消除(自动回复/手动恢复)。 3 . 数据应用:实时监控重要的告警信息,解决并消除告警信息。根据告警信息记录生成报表统计,向上层提供决策的数据依据。 2 概要设计 系统分三层 : 数据的采集 数据处理 数据应用 数据采集:从系统的网元上采集数据包括:性能数据信息,网元告警信息,拓扑结构的配置信息,向数据处理层的制定临时数据库中传送。 数据处理:从指定的数据库中获得原始数据信息,判断处理。根据估值(及性能阀值)判断生成警告信息,存储分析并上报告警信息。实现告警的匹配确认清除,重复告警的归并处理。 数据应用:及时监控重要的告警信息,并处理此告警,反馈告警的确认信息。根据不同的用户需求展现告警统计信息报表,为决策提供数据支持。 数据应用数据的处理数据的采集3 数据采集层 3 .1 内容 3 .1 .1 配置数据采集的内容 及获得该网络中的网元设备,基本信息,与实体形成对应的映射。用于网络的拓扑信息管理。 网管系统管理采集以下配置数据: 3 .1 .2 告警数据采集的内容 3 .1 .2 .1 告警源 需要采集的告警报告分为: 网元告警 路由器: 交换机: 配线板: 服务器:cpu , 内存,硬盘,电源,风扇(散热),网卡,光驱,端口,运行的软件服务 1. 环境告警: 暂保留。 2. 通信连接告警(拓扑管理):当某一网元设备持续一定时间不响应网管系统时,网管系统应能自动生成该网元设备的通信连接警。 3. 性能告警:当性能指标超出预先设定的范围时,系统触发的告警称为性能告警。 4. 设备告警: 来自设备红端的告警信息。 3 .1 .2 .2 原始告警数据内容 原始告警数据是从告警源采集到的未经任何处理的原始告警信息,格式和内容与网元类型相关,原始告警信息将在告警管理应用层进行处理,采集层采集到的告警原始数据至少应包括以下内容: 中文名称 名称 说明 类型 告警的序列号 Alarm_id 告警的序列号 字符串 网元的识别名 Dn 网元的识别名 字符串 告警发生时间 Occu r_time 告警发生时间 时间 告警清除时间 Clear_time 告警清除时间 时间 告警原始类型 org_ty pe 告警类型 ...