湖 仓 一 体 大 数 据 平 台解 决 方 案湖仓一体大数据平台概述 湖仓一体大数据平台,承担了企业数据治理、开发、管理等职责,往下集成数据,往上搭载应用
通过数据同步、研发、运维、服务及治理等过程,对企业大数据进行智能管理,形成企业的数据资产
湖仓一体大数据平台架构基础设施阿里云本地 IDC…华为云某著名企业云腾讯云AzureAWS京东云引擎层S-EMR阿里云 -EMRAWS-EMR华为云 -MRS星环 -TDH数据集成数据研发数据运维数据服务数据治理数据工厂规范建模指标管理参数配置API 工厂脚本 / 向导模式自定义函数导入在线测试 数据查询标签工厂实体管理标签管理任务管理算法工厂算法开发资源管理指标运维指标任务监控指标查询常规运维数据生产运维数据质量运维API 中心 API 授权API 调用数据订阅标签中心量级、覆盖率标签值分布控制台项目管理子账号管理角色权限管理工作空间管理AccessKey管理平台安全设置数据地图数据管理类目管理常规开发离线开发实时开发数据安全数据脱敏数据加密数据规划资产盘点资产盘点报告元数据管理生命周期治理项管理治理效果分析全链血缘元数据检索元数据分析数据探查探查报告探查任务配置探查实例管理数据源管理数据源数据文件规范建表可视化建表DDL 建表数据同步离线同步实时同步API 运维配置、告警安全组配置标签运维标签任务监控标签查询算法运维算法任务监控配置及告警数据标准数据标准管理标准覆盖率评估2
湖仓一体数仓建设思路传统数仓的问题技术架构实时指标烟囱式开发效率低门槛高平台管理实时离线架构不统一依赖离线 T+1 导出报表缺少实时元数据管理未打通实时离线数据的联系宽表建设平台治理湖仓一体数仓建设思路统一数仓标准与元数据基于 SQL 统一开发流程引入 Hudi 加速宽表产出基于 Flink SQL 构建实时数仓数仓平台化建设数据统一接入开发元数据