科研大数据平台项目技术建议书1
项目背景11
需求分析11
方案简述11
方案价值22
设计方案42
设计原则42
系统架构52
分布式数据库系统52
MPP+ShareNothing架构52
核心组件52
高性能在线扩展72
高性能数据加载82
OLAP函数82
HADOOP集群92
Hadoop企业版92
HIVE分布式内存分析引擎92
HBASE分布式实时在线数据处理引擎102
Stream流处理引擎112
服务器虚拟化112
设计理念112
系统结构132
服务器虚拟化系统组成142
云管理平台142
浪潮云海OS架构图152
浪潮云海oS实现的功能152
爬虫软件182
建设网络爬虫私有云182
高效的分布式、协同化数据采集模式192
爬虫路线规划能力202
爬虫调度和负荷规划能力202
极致的开放兼容平台212
为什么需要开放的可集成的网页抓取软件212
集搜客网络爬虫的开放接口213
方案优势223
浪潮MPP数据库优势223
高性能223
高性价比223
高易用性223
浪潮HADOOP优势223
浪潮云计算优势223
运营效率提升223
服务水平提高233
实现数据中心的绿色节能233
分工细化使得终端用户只需专注自身业务233
降低总体拥有成本(TCO)233
可靠性提高243
性能强大243
扩展性好243
可管理性244
推荐配置251
概述1・1・项目背景通过本项目的实施与建设,在以服务科研工作为