基于AIOps的IT自动化运维应用与研究摘要:AIOps(ArtificialIntelligenceforITOperations)已逐渐被证明对于提升运维质量、降低运维成本和提高运维效能方面有着明显改进作用,被认为是IT自动化运维的“终极”解决方案
但是对于大多数企业来说,从传统的运维模式演进成AIOps仍然是一个巨大挑战
本文分析了IT自动化运维的典型应用场景,着重介绍了典型的AIOps需要具备的五种能力,即感知能力、检测能力、定位能力、业务能力和交互能力
本文提出的AIOps系统采用了模块间互操作服务的分层设计,使其能够很好地兼容传统的异构系统,不仅实现了与一些关键技术的融合,包括数据类别,数据库集群,服务网关和操作安全,而且已部署在一个复杂的大型IT环境中,有数百个设备节点
测量结果表明,在类似服务器“PING”故障等模糊诊断信息情况下,AIOps系统的故障自愈率可超过80%
关键词:AIOps;IT运维;自动化运维;AIOps系统1
IT自动化运维概述当今IT运维环境比以往任何时候都更加复杂,现代IT系统能在短时间内产生的海量数据和数亿级的告警信息,如何去管理这些数据以及发现其中的故障隐患,对于IT运维团队来说是一项巨大的考验和挑战
AIOps已被证明对于提升运维质量、降低运维成本和提高运维效能方面有着明显改进作用
IT运维部门可以削减约70%的人员数量,大大减少人工成本的开支
AIOps预计将是IT自动化运维领域的“终极”解决方案,随着近年来人工智能技术应用的日益普及,无论是互联网公司还是中小企业都在探索建立自有的基于人工智能的IT自动化运维管理系统或平台
IT自动化运维中的AIOps应用分析例如系统开发,已经从交付盒装产品转变为发布服务产品(包括在线服务和应用程序)
服务的构建和发布方式均不同于传统的盒装产品,是一种促进服务持续开发和发布的方法,已被广泛