机房运行维护工作建议书为加强********单位数据中心机房各系统的运行维护和管理工作,保证系统长期稳定、高效运行。根据**************信息化工作管理规定,编制适合于******机房运维方案.1. 运维现状分析******数据中心机房目前由*******部门管理,由指定的外协公司承接基本运维工作,其职能限定于出入安全、配件管理、设备管理、运行物理环境管理。对于设备本身及其运行维护、软件运行维护等工作,仍由各个供应商按项目签订的协议提供免费服务,目前这些免费服务大部分处于过期或者即将到期的状态。目前机房运维没有涵盖桌面终端、大楼综合布线、楼层配线间与设备间等,未构成一个完整的运维体系。1.1. 故障连带现象多方运维导致机房出现中断或者服务不良的情况时有发生。********公司机房由于始终未能受到法律规范统一的运维管理,加上机房作为数据核心,由各种外部单位组成的运维团队无论在数据安全性、人员责任感、技术全面性等方面,都难以保持机房的持续性运转。我们没有精确的数据来说明机房的运行情况,这也是目前运维工作尚未达标的一种表现,同样,这也导致我们对现状无法进行精确描述。但是,通过一些现象仍然可以发现机房运维工作应该大幅度改进.1.1.1.长时间断网具体原因不详,但由于机房服务器大部分无法接通,成都地区的二级单位网络依赖的 DHCP 服务无法使用等现象持续多个小时,发现晚,响应慢。1.1.2.上班时间网速慢具体原因不详,但简单归结为 SEP 或者人多并不能完全的解释网速慢的问题,由于网络是信息化建设的基础,充分发挥机房内部与外部的资源是运维工作的重要职责.1.1.3.服务意外退出当虚拟机系统开始引入后,我们时常发现挂载在虚拟机系统上的一些服务器无故宕机且不知道任何原因,当用户需要使用时,由于无法自动恢复,影响正常工作。1.1.4.不易寻找责任人机房是一完整的整体,涉及到环境、网络、服务器、存储、操作系统、数据库、应用软件等,当一个故障发生时,难以判定故障原因,而目前机房是各个外协单位各施其责,最终造成故障排除时间缓慢,相互推诿的情况时有发生。1.2. 半自动化运维现状目前许多企业的 IT 运维已经实现从人工运维到计算机管理,但延展咨询在同客户的沟通中发现其中很多企业的 IT 运维管理还只是处在“半自动化"的运维状态。因为这种 IT 运维仍然是等到IT 故障出现后再由运维人员实行相应的补救措施。这些传统式被动、孤立、半自动式的 IT 运维管理模式...