1 .1 数据稽核 1 .1 .1 稽核策略 如图所示,DM 数据稽核的大致思路是通过数据完整性、数据一致性、数据准确性三方面依次对 DM 层数据进行稽核,每一步都为下一步做准备,层层递进,环环相扣,以保证 DM 获取层、基础层、衍生层、复合指标层以及视图层的数据质量。 应用数据层接口层准确性复合指标层完整性、准确性基础数据层一致性衍生数据层一致性数据获取层完整性、一致性、准确性从兴管控平台 1 .1 .1 .1 数据完整性 数据完整性稽核主要包括,实体是否在规定的时间点提供了并加工生成了数据,实体中指标是否完整覆盖订阅指标两个方面,首先考虑实体中各账期各省份是否有数据(即判断数据是否缺失),只有在实体有数据的基础上才能做进一步的数据稽核,其次检查数据中指标是否满足需求,是否包含指标订购的指标。 实体是否在规定的时间点提供了并加工生成了数据,相当与已经具备了一个完整的木桶,指标覆盖了订购,相当与已经盛满了鱼。 数据完整性稽核的目的也就是,用完整的“木桶”,盛满我们需要的“鱼“。 1 .1 .1 .2 数据一致性 数据在由数据源到数据获取层,数据获取层到基础数据层,再由基础数据层到衍生数据层的传递过程中,数据能否保持一致也成为纵向实体间稽核的内容。在此基础上,检查横向实体间在相同口径下的相同指标的指标值是否一致。 虽然实体间相同口径下相同的指标是建设集市极力避免出现的,但是一旦出现并使用,就要要对此进行严格的稽核管控。 这种大量横纵十字交叉的方式进行一致性的检查,便形成了一种网状稽核。数据一致性网状稽核的目标便是无“漏网之鱼”。 复合指标层的一致性稽核主要包括复合指标层实体内上期值、累计值等对应一致的稽核,这不仅保证了复合指标层的数据一致,而且便于数据的准确性稽核。 1 .1 .1 .3 数据准确性 数据在时间推移的过程中不可能一成不变,会按着一定规律波动,我们依照以往指标数据,确定不同指标的波动上限,波动下限,形成一个指标的正常波动范围。 在数据保证完整一致的基础上,对当前更新的月数据作环比来表现月指标的变化状况,对当前更新的日数据作同比来表现日指标的变化状况,严格控制阀门,一旦超出指标正常波动范围,准确及时地找到异常数据。 另外,我们用排名对比的方法体现复合指标层指标较上月的排名变化,把指标省内排名和全国排名变化较大的标记为异常指标。 以上是本月比起上月同期值的变化情况,如果指标为异常,我们并不...