IT 管理工作思路现在对于科技的投入越来越大,设备数量的增多,应用的增多,应用复杂度的增加,均使得日常维护等管理工作变得比过去更加严峻和复杂,内部需求的驱动也使得这一切变得更迫切
因此, IT 运维管理不能仅满足于业务系统运行能正常运行,如何加强 IT 运维的安全性、可用性,提高响应时间,提升管理效率,便成为科技部门在开放平台服务管理方面面临的挑战
如何构建一个坚实的 IT 运维基础,无论从具体的操作还是到日常管理方式和应急事件处理,都要预先进行规划,为以后降低运营成本,保证业务稳定、持续健康地的进展制造良好的条件,以下是关于 IT 运维工作的思路
一、各类业务系统和企业网系统根据分行需求及时部署到位并开展运行维护(1)系统运行能力管理 能力管理主要关注业务和 IT 基础架构之间的关系,它不仅要评价和改进现有服务能力,而且还应分析和预测组织未来的业务需求,从而据此确定未来应当配置的服务能力的级别
在 IT 设备能力管理方面,最重要的手段是定期进行健康检查
定期对目前的设备运行状况进行检查,检查其处理能力能否满足当前以及将来的业务需求,并且检查其处理能力是否已经发挥其最佳效能
然后,对检查的结果进行分析,假如处理能力不足,那么可以考虑更换和增加设备、系统拆分等方式来提高服务器处理能力
(2)资源监控 资源监控是保证设备持续稳定运行、防范突发故障的重要措施,它和 IT服务可持续性和可用性管理相衔接
资源监控基本分为三类:硬件监控、系统资源和应用资源
其中,对于硬件监控,目前仅个别硬件厂商能提供监控软件,但功能和范围有限
所以,应进行统一考虑,尽早实现统一监控
针对系统资源,目前比较完善的监控平台,能够对目前主流的系统平台的资源,如CPU、内存、I/O活动情况等,提供简单有效的图形显示方式,并且能够根据预定义的阀值进行报警,对主流的数据库、中间件的各种信息,也有相当丰富的