实时大数据平台规划设计方案一、相关概念背景1
1 从现代数仓架构角度看待实时数据平台现代数仓由传统数仓发展而来,对比传统数仓,现代数仓既有与其相同之处,也有诸多发展点
首先我们看一下传统数仓(图 1)和现代数仓(图图 1 传统数仓StreamrngDataDevices&SensorsDataLaDemographicsD^taBatchETOperationalDataStore-飞―-Federate^QueriesOrganistionalPita〜ThirdPartyOata—R7IItII律AHadoop*—1—MackilneiY|(t 叭DataWarehouseOLAPSemanticAdvancedAnalyticsSelfServiceReports&ModelsSafaMartOperAticnaiReportingHistoricalin-MemoryAnalyticsModernizinganExistingDW图 2 现代数仓传统数仓大家都很熟悉,这里不做过多介绍,一般来说,传统数仓只能支持T+1 天时效延迟的数据处理,数据处理过程以 ETL 为主,最终产出以报表为主
现代数仓建立在传统数仓之上,同时增加了更多样化数据源的导入存储,更多样化数据处理方式和时效(支持 T+0 天时效),更多样化数据使用方式和更多样化数据终端服务
现代数仓是个很大的话题,在此我们以概念模块的方式来展现其新的特性能力
首先我们先看一下图 3 中 MelissaCoates 的整理总结:AdvancedanalyticsWhatMakesaDataWarehouse"Modern"在图 3MelissaCoates 的总结中我们可以得出,现代数仓之所以“现代”,是因为它有多平台架构、数据虚拟化、数据的近实时分析、敏捷交付方式等等一系列特性
在借鉴 MelissaCoate