E-Science环境下科学数据的整合与共享〔摘要〕E-Science环境下科学数据实现共享的关键在于标准化,共享的前提是制定标准的规范;实现有效的科学数据整合,使地理分布无关的计算资源、数据资源、存贮资源的全球自动配置和共享。〔关键词〕E-Science;科学数据;整合与共享〔中图分类号〕G255〔文献标识码〕B〔文章编号〕1008-0821(2009)05-0128-03IntegrationandResourceSharingofScientificDataunderE-scienceEnvironmentYaoSongtao(Library,HenanUniversity,Kaifeng475000,China)〔Abstract〕Thekeyofimplementingscientificdatasharingundere-scienceenvironmentisstandardization;scientificdatashouldbeintegratedefficiently,soastoautomaticallyallocateandsharethecomputingresources,dataresources,storageresourceintheglobalrange.〔Keywords〕e-science;scientificdata;integrationandsharing1E-Science及其特点现代科学研究的问题空前复杂化,20世纪末产生了一种崭新的科研协作模式和大科学工程——E-Science。E-Science中文译法有“数字科研”、“电子科研”、“电子科学”、“科学研究信息化”,它是一种以网格为基础的新的科学研究环境。“E-Science”的概念是英国人先提出来的,它是建立在新一代网络技术(Internet)和广域分布式高性能计算环境(Grid)基础上的全新科学研究模式,以互联网技术和网格计算技术为基础,实现跨越地理界限的全球大规模数据采集、T级高速计算和高性能可视化,并以此为基础将互联网的应用、高性能科学计算及资源共享提高到一个全新的层次。在这种环境中,地理位置、分散的各种仪器设备、计算资源、数据资源等被虚拟的集成到一起,科研此资料由网络收集而来,如有侵权请告知上传者立即删除。资料共分享,我们负责传递知识。人员可以自由的使用各种资源,无需考虑资源的存储地和提供者,这种使用突破了时间、物理空间、逻辑空间上的障碍。E-Science具有如下特点:首先,E-Science是一种信息化的基础设施,它提供了一种信息化的科学研究环境和平台,使得不同学科领域的科研活动能够有针对地开发特定的科学研究与应用;其次,E-Science的建立应以应用需求为导向;另外,E-Science的实现需要大量的新技术,事实上E-Science正是20世纪后半期IP技术尤其是20世纪后10年IP技术的产物[1]。它所需要的最具代表性的是网格技术,正是通过网格才有可能将E-Science所需的众多技术与资源,如分布式计算技术、网络安全技术、协同工作技术、资源管理技术等等集成一体,构成并实现了E-Science。2中外科学数据共享的现状2.1国外科学数据共享的现状随着经济发展的全球化和全球性科技活动的不断增强,导致全球范围内的科技人员对科学数据信息资源的交流、互通和深度使用有强烈需求和高度依赖。近20年来,美国、俄罗斯、英国、法国、加拿大、日本和新加坡等发达国家相继颁布了有关科学数据信息共享的政策法规,开始实施科学数据共享工程。目前国际上实施科学数据共享主要体现在3个方面:第一,政府投入大量资金支持科学数据的长期积累、高效流动和低成本使用;第二,从法律、政策等多方面保障科学数据的管理与共享服务;第三,科学数据共享主要采用国家调控下的事业性运行模式。2.2我国科学数据共享现状科学数据是科技活动的结晶,是科技发展与创新的基石,是国家安全和社会经济发展的重要保障。但科学数据共享却在我国长期以来没有得到应有的重视。具体说,我国科学数据的共享现状是:①目的单一,以自用、完成任务为主,只能为少数人使用,得不到及时的更新。②分散在各个单位、数据观测点、科学家个人手中,许多珍贵数据记录已因年久而损毁或散失。③无统一的数据规范标准,标准化程度很低,从根本上降低了数据共享的可能。④重复建设,浪费大量人力、物力和经费。国内虽然此资料由网络收集而来,如有侵权请告知上传者立即删除。资料共分享,我们负责传递知识。在科学数据共享方面的工作起步较晚,但是在国家科技部的领导下,近年来,在整合已有科学数据资源、推动科学数据共享方面作了...