服务器系统故障应急预案1、服务器应用系统出现故障,系统恢复应急预案(1)当服务器应用系统出现故障,安全管理员、系统管理员、应用管理员应当立即初步确定故障的严重程度,估计出现故障的应用系统故障排除需要的时间,并根据应用系统需要保障的无故障运行时间,采取不同的应用系统恢复策略
(2)如果应用系统不能停机,立即启用热备份系统进行工作
如果应用系统不能停机,而故障又可以在10分钟之内排除,那么安全管理员指导系统管理员和应用管理员立即排除故障,恢复系统正常运行
应用系统可以停机而故障又可以在2小时内排除,安全管理员,应该断开服务器的网络连接,配合系统管理员和应用管理员,处理服务器故障,尽快排除故障,恢复系统运行
应用系统可以停机但故障排除不能在2小时之内完成,而应用系统有冷备份系统,安全管理员,应该断开服务器的网络连接,通知系统管理员和应用管理员启动冷备份系统,完成应用系统的安装、设置,并进行数据的恢复,保证系统正常运行
应用系统可以停机,而又没有冷备份的应用系统,那么安全管理员应该通知系统管理员和应用管理员,备份现有系统的数据和程序,如果不能进行备份系统的数据和程序,安全管理员应该从备份管理员那里得到应用系统的最新备份
安全管理员在确定了应用系统有备份的情况下,通知系统管理员重新修复或安装操作系统,并配合应用管理员重新安装或修复应用系统并恢复最新备份的数据
如果备份丢失或不存在,安全管理员应该报告信息网络事件应急小组,并求助技术支持商,完成对硬盘数据的恢复
(3)备份管理员在应用系统出现故障时,应该及时查找本地的数据备份,本地的数据备份损坏或丢失,应该立即从异地数据备份复制应用系统的数据备份到本地
(4)系统管理员和应用管理员应在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和技术支持,请求援助,分析故障原