精选两地三中心分布式双活数据中心技术发展趋势2016-06-20作者:赵培(中兴通讯)业务连续性保障一直是IT运维的热点话题,随着近几年政企IT系统集中化的建设发展思路的确定,在数据中心层面的业务连续性保障成为了重中之重。上到国家、行业主管单位,下到企业,都在数据中心层面制定了相关的数据中心业务连续性建设标准、行业指导意见、企业规范等。2007年,国家发布了国标GB20988-2007(信息系统灾难恢复规范);2009年6月,银监会发布《商业银行信息科技风险管理指引》,要求商业银行按照两地三中心的模式建设数据中心。最近两年,随着云计算技术的发展和逐步应用,政府在智慧城市和电子政务云的建设方面也采用了集约化集中建设的思路,为保证集中化建设的数据中心可以为政务应用提供高业务连续性,双活数据中心也基本成为智慧城市和电子政务云解决方案的基本要求。虽然两地三中心模式的概念频频被提及,但目前仅仅在金融行业中的大体量商业银行和股份银行做得好一些,基本建设了两地三中心的模式。中型金融机构(如城商行、农信行)正在按照监管单位要求,逐步建设自己的灾备体系。据统计在国内的160家城市商业银行中,70%以上的银行没有灾备中心,这些银行目前仅有一些简单的数据备份措施,整个系统存在较大风险。而建设灾备中心对于这些体量较小的金融机构也存在投资规模大、选址要求高、运行成本的问题。最近两年,在金融监管部门的要求下,部分规模较大的金融机构采用了双活数据中心的建设方案,但由于故障导致的宕机仍然时有发生,如支付宝由于一根光纤被挖断,从而导致了大规模的网络故障和服务长时间阻断。业界现有的各类双活两地三中心解决方案并不完美,根本无法达到国家关于RTO(故障恢复时间)小于数分钟,RPO(故障恢复点)等于0的要求。通过对淘宝光纤故障、携程程序员误删数据、西部某地方银行37小时服务中断等事故的分析,我们分析发现现有的两地三中心双活数据中心方案存在以下一些问题:精选●传统主-备模式的数据中心只是简单的软硬件资源的堆砌。正常情况下,主用数据中心对外提供业务,备用数据中心处于闲置状态。只有在发生灾难宕机的情况下,业务系统才从主用中心迁移到备用中心来。然而,灾难往往只是小概率事件,企业投入大量人力和物力建设的备用中心大多时候都是处于闲置状态,资源使用率极低。更为重要的是,主-备模式的数据中心的RTO和RPO无法保证业务的连续性,一旦数据中心级别的灾难发生,应用的迁移往往需要各个层面大量复杂的手工工作,如系统和应用层面的重建、数据库的恢复等等。因此在现有传统的数据中心建设模式下,无论采用怎样的优化方式,主-备模式的建设思路对高可用性的提高、业务连续性的保证只能实现量变,却一直没有实质性的跨越。●传统的基于简单备份冗余的容灾体系结构不适应当前复杂的网络计算环境。金融业数据中心承载着大量的大型机、小型机、服务器、存储设备、应用系统和数据,数据和业务及应用系统的集中化,导致了传统的备份冗余的容灾体系结构已不适应日趋复杂的网络计算环境,数据大集中的模式使数据系统的脆弱性在不断地增加,IT系统连续性面临的压力越来越大。●目前建立的灾难备份系统滞后于云计算等技术的发展趋势。随着云技术的应用,数据大集中是企业信息化发展的必然趋势,但是与这个趋势相应的灾备建设相对滞后。目前的灾难备份系统,广泛存在着日志分析、故障诊断、自动化程度不高、应对突发事件和抗风险的能力薄弱等现状。灾难备份系统没有与云计算技术进行很好的融合。●数据大集中给信息系统带来技术挑战。在结构化和非结构化数据爆炸式增长下,数据存储的结构差别大、异构性强。用户对于信息系统提供的服务要求也越来越高,很多关键业务的可用性要求达到99.999%。然而,当前可利用的灾备技术在大量结构化和非结构化数据面前,存在着难以恢复、恢复复杂、恢复时间长、恢复效率低等诸多技术挑战。譬如,数据存储的安全性防护机制不完善,如何实现数据之间的逻辑卷管理、存储虚拟化管理和多链路冗余管理,保证数据的安全性和可用性等,将是巨大的难题,而且还会带来后期容量和性能扩展难等一系列问题。为了解决...