生产系统问题管理流程 一、 目标 问题管理的目标是通过规范生产系统问题处理的流程步骤,来提高对问题的响应速度和处理能力,尽可能降低由于问题发生对 BOSS系统带来的负面影响,提高系统的稳定性,同时通过找出已发生问题或潜在故障的根本原因来减少问题的数量或消除问题的再次发生。 二、适用范围 该流程适用于对下列问题的处理: • 系统硬件和软件的问题 • 应用软件的问题 • 网络硬件和软件的问题 • 生产环境问题 • 系统安全问题 三、相关定义 1 . 问题级别 级别 说明 处理时限 1 系统关键业务停止 对大面积用户的服务造成影响 无其他备份方式使业务立即恢复运行 影响考核指标 10 分钟内对问题有响应 2 小时内解决问题,恢复正常 2 系统关键业务受影响 对部分用户的服务造成影响 无其他备份方式使业务立即恢复正常 10 分钟内对问题有响应 3 小时内解决问题,恢复正常 3 系统非关键业务停止或受影响 对用户的服务没有影响 30 分钟内对问题有响应 由其他备份方式可使业务立即恢复正常 1 0 小时内解决恢复正常 4 暂没有业务受影响 通过监控系统告警或技术人员分析发现的潜在问题和隐患 1 小时内对问题有响应 2 4 小时内消除问题隐患 5 没有业务受影响 无系统告警 中远期可能会出现问题 1日内对问题有响应 7 日内对系统加以改进 2 . 角色和职责 问题管理协调员 负责管理问题管理流程,更新流程文档,监督流程的执行,管理问题管理工具,保存问题记录,制作问题报告。 作为问题管理流程的协调人,确保所有的问题请求都能得到及时响应和处理,并严格按照问题管理流程执行: • 负责接受所有的问题请求,给出第一时间的响应 • 负责根据问题的种类和涉及的系统指派问题处理人员 • 对 1 ,2 级问题立即向计费部经理汇报 • 负责在需要的时候组织问题管理小组召开问题分析会议 • 如解决问题需要涉及系统变更,则负责配合变更管理协调员完成变更 • 负责督促问题处理人员提交问题分析和处理报告 • 负责维护和保存问题记录表 • 负责每月提交问题管理报告 问题提交人 报告问题现象和对系统造成影响的人员,包括值班人员、信息卡处理人员、系统维护人员等。 • 向问题管理协调员提交问题报告单,包括以下信息: 问题发现时间、报告时间...