IT 运维管理和传统的网络管理到底有什么区别呢
我们通过对实际案例来分析,看IT运维管理和传统的网络管理具体有哪些区别
某客户网络规模庞大,有200台左右网络设备,50台左右服务器,还有几台安全设备,存储设备,在此这些基础设施上运行着相关应用服务
同时,还有SAP业务系统
但最近,SAP系统总是运行不稳定,导致工作流程受到了很大影响
本来采用 SAP系统的目的是提高工作效率,但现在正相反
而 SAP供应商,经过多次查找分析得到的结果是:SAP系统没有问题
技术人员感到非常困惑
于是,使用设备厂商的网络管理软件,查看设备配置,没有问题; 再用第三方网管厂商的网络管理软件,只发现设备负载偏高,但设备本身运转正常
这跟 SAP不能稳定运行没有直接关系,仅此而已; 最后运维系统上阵,除了对设备负载有告警之外,还能自动得知有机房的温度告警发生,而且这种状态一直没有恢复过
这是怎么回事呢
进入运维管理系统,对系统报警日志进行了查询,发现其中有一条较早的告警是关于机房温度的,告警内容是温度偏高,再仔细一看报警时间,刚好是业务系统运行不稳定开始的那一天
机房温度偏高
不大可能啊,前段时间才刚换过空调
于是,技术人员抱着将信将疑的心态决定亲赴机房,查看究竟
果然,打开机房门,热浪迎面,机房像桑拿房
空调出了问题,运维系统的温度告警准确无误
技术人员恍然大悟
网络设备跟人一样,温度高,人脑开始发昏
而环境温度高了,CPU负载变大,设备对响应和请求的延时自然加大
这会直接导致连接在网络设备上的服务器和主机,对外访问或者提供服务时,延时加大,建立在此基础上的业务系统的运行自然难以得到保障
在对空调进行修理后,机房温度降低,设备负载恢复正常,设备响应加快,网络恢复通畅,SAP系统又回到了正常的工作状态
从这个案例可以看出:管理环境如此复杂的今天,没有什么问题一定是局限在某一领域内发