服务器运行维护流程1
日常服务器运维部自我巡检:(1)每日早 8:00 通过 cacti 监控软件查看所有服务器总流量、单兵流量、CPU 和内存使用情况、硬盘使用情况等运行是否正常
例如以下为硬盘根目录的使用情况:(2)对异常单兵服务器进行查看 CPU、内存占用率等进行详细分析和排查
(3)对异常单兵进行所有服务进程检查,看是否正常,并进行排查
(4)查看使用用户,是否有异常用户登录
如有异常用户登录,查看该用户下的文件是否有木马、病毒或有威胁的文件,进行删除和维护
(5)查看服务器系统是否需要打新的补丁,如需升级,进行升级
(6)在服务器和本机上同时对网页的打开速度进行测试,登陆到系统上查看系统页面中程序运行是否正常
(7)对公司五大系统接口进行打开测试查看是否正常
测试内容:集采平台打开测试;便利店系统打开测试;云仓储接口打开测试;云管理接口打开测试;云支付买买金接口打开测试
周和月服务器运维部自我巡检:通过查看监控周流量和月流量、服务器各项硬件使用情况查看等分析(1)在管理工具中查看事件查看器中的应用、安全、系统、日志中的工作状态,是否有异常情况,如有进行清除和修复,每星期进行一次清除工作
(2)每两个星期检查一次操作系统日志
(3)每星期定时对服务器的网站程序文件进行备份
备份原则上采纳数据库完全备份加日志备份策略、web 前端增量备份;备份数据存储策略:本机、异机、2 个级别
重要更新时间点前后必须做数据库备份或日志备份,特别是在做数据库表更新、应用程序更新
每天检查所有数据库备份操作是否正确完成、异地传输是否正常完成,并填写检查表
在异地备份数据准确存储后,可以将超过 2 周以上的异机备份数据通过自动删除脚本进行删除,以便腾出存储空间
(4)为保证服务器系统正常运行,每星期对系统盘 C 盘进行垃圾清理和维护
(5)在数据库服务器、关键应用服务器上,只