H3C 大数据产品技术白皮书杭 州 华 三 通 信 技 术 有 限 公 司8/27/2025 目 录1H3C大数据产品介绍...................................11 。1产品简介.......................................11.2产品架构.......................................11 。2 。1 数据处理...............................21.2.2 数据分层...................................31 。3产品技术特点...................................4先进的混合计算架构...............................4高性价比的分布式集群.............................4云化ETL.............................................4数据分层和分级存储...............................5数据分析挖掘.....................................5数据服务接口.....................................5可视化运维管理...................................51.4产品功能简介...................................6管理平面功能:...................................6业务平面功能:...................................62DataEngine HDP 核心技术...............................83DataEngine MPP Cluster 核心技术......................83 。1MPP + Shared Nothing 架构......................83.2核心组件.......................................93.3高可用.........................................103 。4高性能扩展能力.................................103 。5高性能数据加载.................................113 。6OLAP函数.....................................123 。7行列混合存储...................................121 H3C大数据产品介绍1.1产 品 简 介H3C 大数据平台采纳开源社区Apache Hadoop2.0 和MPP 分布式数据库混合计算框架为用户提供一套完整的大数据平台解决方案,具备高性能、高可用、高扩展特性,可以为超大规模数据管理提供高性价比的通用计算存储能力.H3C大数据平台提供数据采集转换、计算存储、分析挖掘、共享交换以及可视化等全系列功能,并广泛地用于支撑各类数据仓库系统、BI系统和决策支持系统帮助用户构建海量数据处理系统,发现数据的内在价值。1.2产 品 架 构H3C 大数据平台包含4 个部分:第一部分是运维管理,包括:安装部署、配置管理、主机管理、用户管理、服务管理、监控告警和安全管理等。第 二 部 分 是 数...