云存储技术规范——上海电信互联网部2010年7月1、总则1.1编写目的为了更好的推进网盘项目招标和工程规范实施,特此编写此技术规范,对系统的各个特性和性能要求提出具体要求,起到规范统一的作用。1.2建设背景和目标随着互联网的急速发展和非结构化数据的爆炸性增长,公众对高效,快速,分布式存储提出了更高的要求。中国电信云存储方案基于这个需求被提出来。1.3适用范围中国电信云存储项目1.4起草单位中国电信股份有限公司上海分公司互联网部1.5解释权中国电信股份有限公司上海分公司互联网部1.6术语解释1.7参考文献1.8设计要求及使用条件1.3.1总体设计要求要求系统部署合理,提供完善的网络硬盘服务,提供完善的开发接口,提供及时有效的售后服务。1.3.2使用条件满足一般条件下的使用条件。2、技术要求及规范2.1平台架构按照解耦和,多模块的观点,要求系统各个模块结构清晰,功能相对独立,便于维护和升级。架构图可以参考如下的模型(图3-1):③①②(图3-1)图详解:①存储业务作为磁盘空间,为中国电信内部自有业务提供存储支撑;②存储业务为公众用户(主要是中国电信客户)提供丰富的个人存储产品和服务;③云存储系统必须提供丰富的业务接口,以支持开发丰富的上层应用。2.2组网结构按照分布式的组网需求,并充分使用中国电信CN2骨干网络,要求全国云存储采取分点组网,快速连接。整个组网结构,请参考如下图(图3-2):(图3-2)2.3功能性要求2.3.1基础存储服务云存储管理平台提供基础的存储资源池,将多个物理设备上的存储资源虚拟为统一的存储资源池,供上层使用。2.3.2存储管理设备管理:通过查询域内所有设备的磁盘、CPU、内存、电源、风扇、网口等信息。让用户实时了解域内设备运行信息,运行状态,从而可以操控设备;同时及时了解运行有误的设备,有必要可以采取适当措施保证其正常运行。资源管理:用户可以方便的了解云存储系统的各个节点的服务情况,包括MDS的主备、MDS\OSN的容量和性能(读IOPS、写IOPS、读流量、写流量)等信息,让用户实时了解域内资源信息,运行状态,从而可以操控这些资源;同时及时了解资源的异常,有必要可以采取适当措施保证其正常运行。2.3.3策略管理云存储平台提供灵活的存储策略,包括文件的副本数量、异地存储、加密存储、压缩存储、同步或异步存储。可以对用户不同目录设置不同的存储策略。2.3.4多租户管理云存储平台要求能支持对多租户的管理,可以为每个租户设定存储空间、存储带宽、存储策略、用户数。租户可以设置管理子租户和孙租户,形成目录树结构。2.3.5统计报表云存储管理平台提供统计报表接口,能够完成用户存储容量、存储数据访问量等数据的统计2.3.6多线程支持云存储管理平台提供的接口支持多线程及断点续传上传下载文件。2.3.7跨数据中心部署云存储管理平台要求支持跨数据中心的部署和管理,并支持跨数据中心的用户访问调度、数据迁移、数据异地存储备份等功能。支持集中管理,云存储管理平台部署在全国中心机房,存储节点可以部署在全国各机房中,管理平台对分点机房的存储设备可以统一管理调度。2.3.8数据写多份云存储平台要求能够针对不同应用或用户的可靠性和性能需求,灵活设置文件存储的副本数。在满足数据可靠性要求(要求支持同时坏任意两块磁盘数据不丢失)和读写性能要求的前提下,尽量提高存储空间利用效率,降低存储成本。2.3.9分级安全服务传输安全云存储系统采用HTTPS(SecureHypertextTransferProtocol)安全超文本传输协议,是以安全为目标的HTTP通道,简单讲是HTTP的安全版。Https:URL表明它使用了HTTP,但HTTPS存在不同于HTTP的默认端口及一个加密/身份验证层(在HTTP与TCP之间)。这个系统提供了身份验证与加密通讯方法,目前广泛用于万维网上安全敏感的通讯,例如交易支付方面。云存储提供的业务接口及管理接口都基于Https,从而保证数据的在传输层的安全。存储安全云存储系统在数据存储时,根据条带策略,将用户数据根据侧录进行分条,根据条带策略决定每个分条的大小,数据分条的存储物理位置等。数据的所有分条及布局信息是元数据的一部分内容,由元数据节点统一管理。...