一体化运行监测管理一、一体化运维思路(1)一体化运行维护管理平台将所需要监控运维的内外场设备、资源配置管理、运维流程、运维可视化展现和门户等功能整合在一起,并逐步结合日常运维管理规范和体系,实现统一的监控数据采集、一体化的报警数据处理、集中的配置管控、统一的故障流程处理,实现运维端到端闭环的处理环节,确保发生一事、处理一事、关闭一事,让运维工作不再复杂、无序,而是规范、高效、有序的。(2)统一的资产配置管控管理构建统一的资产配置管理数据库,实现资产配置信息的联合、灵活、合规化管理,将生产环境中的各类硬件、软件,外场感知设备、立杆/柱、取电信息以及内场的物理/虚拟服务器、数据库、网络、业务系统、中间件、文档、虚拟资源等应统一纳入管理,实现资产配置信息的可控、可视与可管理,协助分析故障影响范围、变更影响范围,帮助运维人员厘清生产环境中配置信息及其关联关系,为整体环境的运维管理提供支撑作用。配置管理数据库的建设要支持灵活、动态、可视化原则,能够快速构建符合金华银行管理需求的配置模型,支持模型的灵活定义和修改,支持配置信息的多种采集方式,能够协助用户方快速梳理、收纳生产环境中的资产配置信息,并通过可视化的配置视图和关系视图来直观呈现出配置关系,绘制一幅描述配置信息的“地图”,为故障定位、影响分析等提供配置依据。(3)集中的基础架构监控管理综合运维管理平台的基础架构是构建信息化运维管理的基础,所有业务系统均依赖于网络、云平台、操作系统、数据库、中间件、存储、应用服务等基础架构运行,各项资源的运行稳定直接关系到业务系统乃至日常业务工作的正常开展因此有必要对这些分散的IT资源进行全面的监控,了解每一项资源的运行性能和告警信息,一方面通过了解资源的运行性能,分析资源运行趋势,掌握资源运行态势,能够进一步合理利用资源,对IT资源的使用、分配和调整提供容量依据,掌握资源运行规律,降低乃至避免各种运行风险;另一方面通过合理的阈值监控和告警机制,及时将IT资源的异常和故障情况快速告知运维人员,实现故障的快速告警、准确定位、及时解决,以保障IT资源的稳定运行。(4)规范的运维服务流程管理以ITIL/ISO20000等标准和实践为指导,设计、建立符合用户实际情况和管理需要的运维服务流程,树立面向业务服务的IT运维管理理念,建立科学合理的流程指标,由粗放管理向精细管理转变;实行集中统一的IT运维管理模式,由分散管理向集中管理转变;建立统一高效灵敏的网络管理系统,由无序服务向有序服务转变;建立规范标准的IT运维管理流程,由职能管理向流程管理转变;应用先进、实用、高效的IT运维管理工具,由被动管理向主动管理转变。(5)运维决策支持建立直观、真实的运维可视化展现,综合网络中的感知终端、通信设备、网络传射、应用系统等各类资源运行情况以及运维技术人员的日常运维管理工作情况,有效的展示内部的IT资源运行情况、性能状况、服务工单情况等,使领导、管理者、技术人员能迅速了解自己关心的问题,满足不同层次人员对系统一目了然直观了解的需求。二、系统功能系统提供运行状态监控功能,运行状态监测功能主要依托成熟的运行监控软件zabbix等软件,实现对相关主机系统、桌面PC机、网络设备、安全设备、数据库、存储系统、IT环境的集中监控和管理,基于流数据进行网络安全分析,能够及时采集各类告警信息、性能数据和配置数据,进行集成统一的分析、查询、报告和展示等。运行监测的功能包括但不限于以下几个方面:(1)设备资产服务管理主要实现设备全生命周期可视化管理、便捷智能的维修任务分配和维修过程管理、同时包含有计划的设备巡检、备件出入库管理等功能,将运维管理相关的人员、设备、数据、流程集成在一个平台中并进行充分的交互及共享。包括备品备件管理、设备管理、故障维修、巡检计划、综合统计分析以及系统参数管理等,主要负责整体运维业务的管控,决策分析和系统运行设置。(2)设备运行综合监控基于图形化管理平台,管理各种设备异常预警信息和维修任务的下发,管理设备故障维修的进展和运维人员的处置进度。主要功能包括综合数...