1、数据仓库基本概念1・1、主题(Subject)主题就是指我们所要分析的具体方面
例如:某年某月某地区某机型某款App的安装情况
主题有两个元素:一是各个分析角度(维度),如时间位置;二是要分析的具体量度,该量度一般通过数值体现,如App安装量
2、维(Dimension)维是用于从不同角度描述事物特征的,一般维都会有多层(Level:级别),每个Level都会包含一些共有的或特有的属性(Attribute),可以用下图来展示下维的结构和组成:以时间维为例,时间维一般会包含年、季、月、日这几个Level,每个Level一般都会有ID、NAME、DESCRIPTION这几个公共属性,这几个公共属性不仅适用于时间维,也同样表现在其它各种不同类型的维
Attributes1
3、分层(Hierarchy)OLAP需要基于有层级的自上而下的钻取,或者自下而上地聚合
所以我们一般会在维的基础上再次进行分层,维、分层、层级的关系如下图:年),如下图所示:aaCanadIllinoiNewYorkBuffalChicagmuntipravmcc_I^BrilishColumbiaorstateNewYurlkJjOttawacity住niK■[yk阳『iQ|I^TororiitoHlerarchylHierarchy_2McmberlMember^Mcmb&rTotLevelDLevel1MemberlMember
Dimensio每一级之间可能是附属关系(如市属于省、省属于国家),也可能是顺序关系(如1
4、量度量度就是我们要分析的具体的技术指标,诸如年销售额之类
它们一般为数值型数据
我们或者将该数据汇总,或者将该数据取次数、独立次数或取最大最小值等,这样的数据称为量度
5、粒度数据的细分层度,例如按天分按小时分
6、事实表和维表事实表是用来记录分析的内容的全量信息的,