中图分类号:TP393文献标识码:A文章编号:1009-2552(2011)06-0210-03基于NAS和SAN的数字图书馆网络存储系统的研究张王莹王莹(首都医科大学附属北京妇产医院,北京100026)摘要:介绍了网络存储系统在数字图书馆建设中的重要意义,分析了数字图书馆数据存储的现状及模式,分别阐释了现有网络存储的主要技术,即NAS和SAN各自的技术特点。最后给出了基于NAS和SAN技术的数字图书馆数据存储系统的整体解决方案。关键词:NAS;SAN;网络存储;数字图书馆ResearchonnetworkstorageforthedigitallibrarybasedonNASandSANZHANGYing-ying(BeijingObstetricsGynecologyHospitalAttachedtotheCapitalMedicalUniversity,Beijing100026,China)Abstract:Thisessayintroducedtheimportanceofnetworkstoragesystemindigitallibraryconstructionandanalyzedthedevelopmentofdigitallibrarydatastoragetechnologyandplatform.ItpresentstwointerpretationsforthepresentnetworkstoragetechnologieswhichincluderespectivetechnicalfeaturesforNASandSAN.Finally,itmadeanintegralsolutionbasedonNASandSANtechnologyfordigitallibrarydatastoragesystem.Keywords:NAS;SAN;networkstorage;digitallibrary0引言随着电子文献资源的日益丰富和不断扩充,访问数字图书馆查阅资料的上网用户也越来越多,如何面对呈几何级增长的数据存储压力同时又能高效检查和管理,为用户提供优质快捷的服务,已成为目前摆在数字图书馆建设者面前亟待解决的问题[1]。馆藏的电子文献信息的载体从原来的计算机硬盘、光盘发展到磁盘阵列、磁带库等存储设备,这些设备具有存储容量大的特点,堪称海量存储。近几年图书馆数字化资源建设的步伐明显加快,很多图书馆的数字化资源早已达到了TB级[2],所以在数字化信息爆炸式增长的情况下,建设一个稳定、高效的网络存储系统是对数字图书馆的必然要求,以存储为中心也将成为数字图书馆发展的趋势。1存储现状及传统存储模式现代数字图书馆的电子资源类型有很多,例如:电子期刊全文数据库、文摘数据库、引文数据库、电子图书、事实数据库、电子报纸、学位论文数据库等等。目前,国内市场上还有很多商品化的电子资源产品,其中比较知名的产品有超星电子图书、书生之家电子图书、读秀知识库、CNKI中国期刊全文数据库、万方数据库、VIP中国科技期刊全文数据库等等。另外图书馆还有很多自建数据库和VOD等多媒体数据,特别是连续出版物的数据不宜断档,各个数据库的数据都在源源不断地扩充,这就要求存储设备的容量要非常大且有很好的可扩展性[3]。截止到现在累计数据存储容量已达到几十个TB,在这种数字化信息爆炸式增长的情况下,海量存储是对图书馆的必然要求,以存储为中心也将成为现代化数字图书馆的发展趋势。传统的图书馆存储系统中,这些海量数据往往分别存储在几台磁盘阵列上,通过院内局域网连接终端客户机以供上网读者检索,这种传统的存储方式称为直接连接存储(DirectAttachedStorage,DAS)[4]。在DAS体系结构中,每一个磁盘阵列与自己专用服务器相连,使大型数据源的数据不能跨阵列存储,存储空间不能得到充分的利用,这样势必造成存储空间的浪费,其次DAS系统每一组阵列的存储容量不能无限制地增长,其可扩展性差,并且当用户数量增加或服务器正在提供服务时,其响应速度就会变慢,出现瓶颈。这种存储方式并不能提供真正意义上的网络存储,难以适应数字图书馆的建设和发展。2数字图书馆网络存储主流技术目前网络存储技术最为成熟和应用最广的有以下两种即网络附加存储(NetworkAttachedStorage,NAS)和存储区域网络(StorageAreaNetwork,SAN)[5]。NAS不像DAS那样通过I/O总线附属于某个特定的服务器,而是通过RJ-45接口与网络交换机直接相连。作为网络中的一个节点设备,是一种即插即用的设备,其设备通常集成了处理器和磁盘柜,连接到TCP/IP网络上,应用服务器对它仅仅起到控制和管理的作用,客户机对存储设备的访问不再像DAS那样需要通过网络服务器转发而是直接进行数据存取。可将网络服务器及繁重的I/O负载中解脱出来,因而具有更快的响应速度和更宽的数据带宽,...