科研大数据平台项目技术建议书目录1.概述ﻩ11.1.项目背景.....................................................................................................................................11.2.需求分析.....................................................................................................................................11.3.方案简述..............................................................................................................................11.4.方案价值ﻩ22.设计方案............................................................................................................................42.1.设计原则ﻩ42.2.系统架构ﻩ52.3.分布式数据库系统...................................................................................................................52.3.1.MPP+ShareNothing架构ﻩ52.3.2.核心组件ﻩ62.3.3.高可用......................................................................................................................................................62.3.4.高性能在线扩展ﻩ72.3.5.高性能数据加载........................................................................................................................................82.3.6.OLAP函数............................................................................................................................................92.4.HADOOP集群ﻩ92.4.1.Hadoop企业版....................................................................................................................................92.4.2.HIVE分布式内存分析引擎ﻩ012.4.3.HBASE分布式实时在线数据处理引擎...................................................................................102.4.4.Stream流处理引擎........................................................................................................................112.5.服务器虚拟化ﻩ112.5.1.设计理念ﻩ122.5.2.系统结构ﻩ132.5.3.服务器虚拟化系统组成ﻩ412.6.云管理平台ﻩ152.6.1.浪潮云海OS架构图ﻩ152.6.2.浪潮云海OS实现的功能ﻩ152.7.爬虫软件ﻩ812.7.1.建设网络爬虫私有云..............................................................................................................................182.7.2.高效的分布式、协同化数据采集模式.....................................................................................202.7.3.爬虫路线规划能力................................................................................................................................212.7.4.爬虫调度和负荷规划能力................................................................................................................212.7.5.极致的开放兼容平台ﻩ222.7.5.1.为什么需要开放的可集成的网页抓取软件...........................................................................222.7.5.2.集搜客网络爬虫的开放接口ﻩ223.方案优势..........................................................................................................................233.1.浪潮MPP数据库优势ﻩ233.1.1.高性能ﻩ233.1.2.高性价比ﻩ323.1.3.高易用性..................................................................................................................................................233.2.浪潮HADOOP优势ﻩ233.3.浪潮云计算优势.................................................................................................................23...