信息系统监控方案系统上线后的日常营运工作中,监控各系统的运行状态相当重要
监控系统的运作状态才能事前发现及处理问题,避开故障发生
若系统不慎发生故障,也能通知相关人员处理
为实现适当的系统监控功能,必须根据系统需求规格要求来选择评估综合系统监控工具
一般的系统监控工具主要有搜集各监控对象 H/W、OS、M/W、AP 等运作状态的‘监控信息搜集功能’,事前掌握问题的‘监控资讯分析功能’,监控到故障的‘警戒值设置功能’、当系统发生故障时的‘故障通知功能’、工具本身管理的‘管理功能’等五大功能
综合监控工具主要五大功能的内容说明如下:监控信息搜集功能 分别进行资源监控、网络监控、SNMP 监控、LOG 监控、JOB 监控
资源监控指透过安装在监控对象主机的 agent,监控主机的 CPU/内存/磁盘空间/网络等资源的使用情况
网络监控指通过 ping 或端口的状态来监控网络是否相通
SNMP 监控为透过 SNMP的 Polling/Trap 方式监控通讯等设备
LOG 监控指利用 syslog、aplog 等 LOG 讯息监控方式,监控硬件、软件的故障
JOB 监控指监控执行程序的工作进程、执行状况
通常利用专门的 Job Schedulling 工具来进行
监控资讯分析功能 将搜集到的信息以分析图、表的方式呈现,例如 CPU/内存/磁盘空间/网络等在一定时间内的使用量变化曲线图等
警戒值设置功能 设定搜集到监控资讯的警戒值,判定系统是否异常
例如 CPU 使用率的警戒值为 80%
故障通知功能 设定系统发生异常时的通报机制,例如发送短信、邮件,紧急情况发生时的电话联络方式等
管理功能 监控主机本身的管理功能
监控信息收集功能在评估监控信息搜集功能时,除了监控项目之外,设定监控项目的容易性,以及监控信息保存方式也必须列入评估项目中
监控项目主机硬件监控监控主机硬件的故障资源监