基于主机平台的两地三中心灾备解决方案的实例分析供稿人:王军方案简介基于主机平台的两地三中心灾备解决方案(Metro/z/OSGlobalMirror),顾名思义是指,在同城距离内的两个中心间采用PPRC(MetroMirror)实现数据镜像,同时在生产中心与远程异地第三中心间采用XRC(z/OSGlobalMirror)实现异地灾备。这一方案兼具高可用性和灾难备份的能力。这一方案针对主机平台,相对于MGM(Metro/GlobalMirror)解决方案,具有软硬件紧密结合、两地间距离无理论上限、支持不同磁盘系统供应商的产品等特点。本文将以两套配置方案为主,通过对比不同场景的测试数据,分析Metro/z/OSGlobalMirror方案中磁盘系统响应时间和磁盘IO的状况,特别是考察在特定场景下,XRC和PPRC协同工作时对磁盘IO性能的影响;并分享在Metro/z/OSGlobalMirror方案设计、规划和实施中的一些经验。配置实例以下三套配置方案的区别主要在于磁盘系统的类型不同,带来的差异主要是IO响应时间上的差异。其中配置三仅用作为观察XRC状况的对比,并不作为建议配置。1)硬件环境主机系统两台z990主机:2084-B16,共约10000MIPS。两台9037Timer。两个sysplex:PLEXP1有四个成员系统和两个CouplingFacility,用于生产系统和PPRC控制系统。PLEXT有两个成员系统和两个CouplingFacility,用于SDM系统。磁盘系统两台ESS800:一台有1TB存储空间,8个CU,每个CU有27个3390-3和6个3390-9的卷,有16GBCache和1GBNVS。一台有1TB存储空间,5个CU,每个CU有48个3390-3和10个3390-9的卷,有16GBCache和1GBNVS。微码:2.4.04.0045两台DS8000:一台有1TB存储空间,8个CU(跨6个Rack),每个CU有27个3390-3和6个3390-9的卷,用于生产系统;有64GBCache和2GBNVS。一台有约1TB存储空间,8个CU(跨4个Rack),每个CU有27个3390-3和5个3390-9的卷,有64GBCache和2GBNVS。微码:5.1.00.02842)软件环境生产系统和PPRC控制系统:z/OSV1.5;DB2forz/OSV7.1;CICSTSforz/OSV2.3;NetViewforz/OSV5.1;SAforz/OSV2.2;GDPS/PPRCV3.2。SDM系统:z/OSV1.6;NetViewforz/OSV5.1;SAforz/OSV2.3;GDPS/XRCV3.3;XRCPerformanceMonitorV1.1。3)配置一拓扑图4)配置二拓扑图*注:配置三中的远程异地磁盘系统优于生产系统的磁盘系统,该配置仅作为观察XRC的对比参考。工具说明1)压力模拟工具DB2Reorg批量DB2的表空间数据集分布在16个3390-3的卷上,DB2activelog数据集分布在8个3390-9的卷上;每次执行作业对4个表空间同时进行Reorg;每个表都根据不同的键值进行2次Reorg;每个表空间包含5M个记录,因此总记录数是20M;平均记录长度是512字节,其中最后一个字段为可变长字符VARCHAR类型。对于批量作业主要考量处理时间(BatchDuration)和IO响应时间(IOResponseTime)。DASTTool一个驱动I/O的批量工具,用于辅助模拟IO压力;调用汇编来对磁盘进行底层的I/O操作;将该工具参数设置为“一读加一写”模式执行两遍,对跨8个CU的16个3390-3卷进行I/O操作,每次I/O操作的时间间隔是2毫秒。CICSAccessVSAM模拟CICS访问VSAM文件的联机交易;总共80个作业运行在同一Sysplex中的两个成员系统上,每个成员系统有两个AOR和两个TOR;每个作业模拟十万个顺序交易,总共模拟八百万个交易;每个交易对VSAM文件有3个I/O操作,两次读和一次写;总共持续约100分钟,每秒交易量达1000笔/秒。对于该应用主要考量每秒交易处理量(TransactionRate)和交易响应时间(TransactionResponseTime)。2)数据收集工具RMF和RMFMagic每分钟采样SMF类型70-79和42的数据,抽取每5分钟的均值生成RMF报告。RMFMagic是数据分析工具,属于IntelliMagic公司的版权软件产品;根据RMF数据产生相应的DSS,Cache,StorageGroup和Device的统计数据并可以导入到Excel表或HTML中。XRCPerformanceMonitorXPM监控XRC的活动情况,以确定XRC的瓶颈/问题;通过ISPF屏幕监控SDM内部操作的情况,其历史数据可以被下载到本地PC导入Excel,然后加以分析;并且通过XPMEXCT和XRCHKVOL观察发生超过Delay阀值的情况和发生Pacing卷的情况。JOBlog记录批量作业的耗...