目 录 1 . 存储方案整体设计 ............................................................................................. 1 1 . 存储方案整体设计 数据的存储是档案扫描系统的核心组成部分,肩负着中国第二历史档案馆关键业务系统数据的存储与保护功能。由于系统包含扫描、加工、应用、数据库等重要系统,我们将依据不同应用特点进行方案设计,按应用性能需求、访问方式等不同的特点提供不同的存储方式。 在本项目当中,数据在进行加工系统中,既需要将数据传送到相应的服务器,也需要将数据进行本地存储。进行本地存储的好处是可以将得到的数据进行本地再处理,也可以作为数据的备份。 整体拓扑结构图: 数据在扫描、加工处理过程中,会从核心存储得到一个存储空间用于文件临时存放,随着业务流程推进,扫描数据最终变成了成品数据,核心存储中会划分一定的空间用于成品数据存放。 由于整个系统数据量比较大,因此对系统的存储容量、存储的方式、数据的安全性、数据的可用性就有较高的要求。 数据存储采用分级存放方式,分级存储定义为三级: 1 .1 在线方式 纸质档案的扫描工作是中国第二历史档案馆的生产系统,为考虑到大量的数据的安全存放,我们建议采用EMC VNX7500统一存储系统和EMC Isilon IQ 108NL群集存储设备作为数字档案的集中存储,并且该系统还需要为数据库等核心业务系统提供高性能的存储环境,同时也能为加工、检索等业务提供NAS共享存储环境。 在线方式主要为应用系统和业务系统提供存储空间,如数据库、应用服务器。以及结合后面的近线存储方式,归档系统会根据制定的策略将数据分成频繁访问和非频繁访问数据,频繁访问的数据会存放在在线的磁盘阵列中。因此,存储设备需要具备稳定、安全、高效及可扩展等诸多性能特点。结合我们的业务类型和数据文件类型,对存储设备进行了选型和定制。 1 .2 近线方式 1 .2 .1 为什么要近线存储 扫描加工后的海量数据需求的增加速度比想象中的更快。所带来的解 决 起 来看 似 不难 ,只 要购 买 更多的主存储设备即 可,但 因此会产生更多的生产效率 和成本 问题 。 新 的存储系统可能很 快地 超 载 ------以指 数级速度增长 的存储设备使 对之 产生的需求预 测 越 来越 难 。新 购 买 的存储系统很 快就不 够 用了 备份 窗 口 越 来越 长 ------随 着 存储量不 断 的增加,备份 时间窗 口 不...