IT 运维管理和传统的网络管理到底有什么区别呢? 我们通过对实际案例来分析,看IT运维管理和传统的网络管理具体有哪些区别。 某客户网络规模庞大,有200台左右网络设备,50台左右服务器,还有几台安全设备,存储设备,在此这些基础设施上运行着相关应用服务。同时,还有SAP业务系统。 但最近,SAP系统总是运行不稳定,导致工作流程受到了很大影响。本来采用 SAP系统的目的是提高工作效率,但现在正相反。而 SAP供应商,经过多次查找分析得到的结果是:SAP系统没有问题。技术人员感到非常困惑。 于是,使用设备厂商的网络管理软件,查看设备配置,没有问题; 再用第三方网管厂商的网络管理软件,只发现设备负载偏高,但设备本身运转正常。这跟 SAP不能稳定运行没有直接关系,仅此而已; 最后运维系统上阵,除了对设备负载有告警之外,还能自动得知有机房的温度告警发生,而且这种状态一直没有恢复过。这是怎么回事呢? 进入运维管理系统,对系统报警日志进行了查询,发现其中有一条较早的告警是关于机房温度的,告警内容是温度偏高,再仔细一看报警时间,刚好是业务系统运行不稳定开始的那一天。 机房温度偏高?不大可能啊,前段时间才刚换过空调。于是,技术人员抱着将信将疑的心态决定亲赴机房,查看究竟。 果然,打开机房门,热浪迎面,机房像桑拿房。空调出了问题,运维系统的温度告警准确无误。技术人员恍然大悟。网络设备跟人一样,温度高,人脑开始发昏。而环境温度高了,CPU负载变大,设备对响应和请求的延时自然加大。这会直接导致连接在网络设备上的服务器和主机,对外访问或者提供服务时,延时加大,建立在此基础上的业务系统的运行自然难以得到保障。 在对空调进行修理后,机房温度降低,设备负载恢复正常,设备响应加快,网络恢复通畅,SAP系统又回到了正常的工作状态。 从这个案例可以看出:管理环境如此复杂的今天,没有什么问题一定是局限在某一领域内发生的,就像案例中所说:业务故障可能是主机系统间不能正常通讯造成的(网络问题)„„网络问题可能是设备运行不稳定赞成的(设备问题)„„设备问题可能是机房环境温度失控引发的„„ 任何单独的管理系统都不足以应对这些问题,真正要找出“事件根源”,我们需要全面、综合的IT运维管理系统来解决实际工作中遇到的问题。这是IT运维管理和网络管理的不同。 另外,可以从概念上来区分运维管理和传统的网络管理的区别。 传统的网络管理,按照制造厂商分为设备厂商...