第1页共29页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共29页一、企业数据仓库1、企业数据仓库概述企业数据平台是商业智能体系的基础,通过建立层次化的数据仓库体系结构、统一的数据模型,整合企业生产系统的数据,从而为数据分析平台和CRM等上层应用提供数据支撑。企业数据平台沉淀了企业多年来的生产经营数据,数据按照存储粒度分为细节级、轻度综合级、汇总级,其数据量通常非常庞大,少则几TB,多则上百TB,而且每天都有大量的生产数据被抽取、整合进入企业数据平台,并传送到数据分析平台和其他系统,以满足其数据需要。如此庞大的数据量、吞吐量和复杂的业务逻辑,对企业数据平台的存取效率、数据质量、易管理性,易维护性等均提出了很高的要求。公司在多年的数据仓库建设过程中研发出一套适用于电信行业的统一数据模型(该模型中的核心部分已经被中国联通作为数据仓库模型的标准规范)。基于统一数据模型、结合数据仓库技术、元数据技术,并对ETL过程进行优化处理,公司实现了电信行业海量数据仓库的标准化构建和高效运转。企业数据仓库(EDW)是企业分析型数据的统一存储,它和运营数据存储一起构成企业的统一数据平台。企业数据仓库在企业内部建立统一的数据架构和数据模型,沉淀来自运营数据存储、生产系统的数据,采用多维分析和数据挖掘手段,细分市场和客户,为企业内各个部门、各个层面的使用者的信息查询第2页共29页第1页共29页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第2页共29页获取、经营分析、决策支持等需求提供全方位的数据支撑服务。企业数据仓库从根本上解决了沉淀数据分散重复、共享困难和信息孤岛问题,充分发挥数据资源价值,提高了企业在信息化建设方面的投资回报率。系统架构系统功能1.数据域划分EDW的数据存储按域可以分为:客户域、产品域、市场营销域、服务域、业务域、竞争域。第3页共29页第2页共29页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第3页共29页客户域以三户模型为基础,客户域包含客户、客户对产品的订购等相关信息,如客户的基本属性、衍生属性,客户的消费、欠费、缴费、行为、结算、服务、产品订购和业务订购等。数据加工主要是以ODS中的营业域、计费域、帐务域、结算域数据进行整合,按照分层次、分类别、多维度进行数据汇总。产品域以产品模型为基础,包括产品的定价、产品基础信息、产品目录、产品生命周期、产品定位、产品营销等信息。数据加工以ODS的营业域、计费域、帐务域、结算域等数据进行整合,按照分层次、分类别、多维度进行数据汇总。市场营销域包含营销活动、营销能力、营销过程、营销结果、渠道等信息。数据来源是CRM系统的营销活动、营销计划、营销执行、渠道等内容,数据加工在ODS的营业域、帐务域、结算域等数据基础之上按照分层次、分类别、多维度数据汇总加工。服务域主要包含对主动服务和被动服务的信息的分析,包括服务能力、服务过程和服务结果等。数据加工在ODS的客服域基础上进行主动服务和被动服务的数据汇总。业务域从单一业务和组合业务的角度分析企业的经营信息,包含了各业务的发展、收入、使用等信息。数据加工在ODS的客户域、营业域、计费域、帐务域、结算域等数据基础上,按照业务为主线进行分层次多维度数据汇总。竞争域包含竞争对手及其产品、营销、发展、话务等信息。数据加工在ODS的客户域、营业域、计费域基础上,按照对端号码归属电信运营商进行多维度、分层次数据汇总加工。2.数据加工(ETL)ETL是英文Extract-Transform-Load的缩写,提供数据的抽取、转换和加载功能。从源系统中抽取目标数据,按照一定的规则进行清洗、集成、转换、汇总等处理工作,并将处理之后的数据加载到数据仓库的目标层中。为了利用目标数据仓库的并行处理能力,一般先抽取、加载,再做转换处理。第4页共29页第3页共29页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第4页共29页3.数据模型支撑企业数据仓库(EDW)是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库,它的数据基于OLTP源...