数据质量体系结构介绍作者:杜绍森编译出处: IT1682008-05-12 09:14 数据质量管理过程是一个没有终点的过程,也没有统一架构原则。这里提供的是一种针对数据仓库项目可以简单实现的、可扩展的、一种相对比较完善的捕捉数据质量事件,同时对其进行量度和控制的方法。本文提供一个在 数据仓库 项目的实施过程中, 可增量添加的、 可扩展的 数据质量 体系结构,它可以保证以最小的对前期投资的影响,并增加到存在的 数据仓库和数据集成 环境中。使用这个架构,也可以实现项目系统化的向6Sigma质量管理体系的扩展。 这个架构的设计也是针对数据仓库领域缺乏的公开的、一致的说明数据质量的问题来进行组织的。有三股力量已将对将数据集成、 数据质量的关注呈现在组织管理层优先执行活动中。它们是:一、普遍地认为 "如果仅能看到数据,而无法确定其质量等级,就无法更好的管理的业务"的认识,正在持续增长。绝大多数的知识工作者相信对自身的工作职能来说,数据是至关重要的; 二、绝大多数的全球化的,分布式的组织机构逐步形成共识, 集成分散在全球各地的业务数据是企业竞争力的必要因素 ; 三、急剧增长法律符合性的要求也是一个重要的因素。仅这三个方面的驱动力, 对于强调数据质量的问题显然还并不充分。幸运的是, 还有一股强大的动力正来自除了IT 部门以外的业务人员。 业务人员正在逐步的认识到数据质量问题是一个严重的,需要高昂的成本的问题, 这样,组织主动性地提供数据质量就有了更大的动力。但是,多数的业务人员可能并不能完全了解数据质量问题产生的原因, 找到提高数据质量的方法。 有时他们认为数据质量问题主要是 IT 部门操作层面的问题。在这样的情况下,IT 部门就应该更加认识到:数据质量问题不可能仅通过IT 部门来单独改善, 更需要业务部门的积极、主动参与。事实上,数据质量领域一个极端的看法认为:" 数据质量问题几乎和IT 没有任何的关联 " 。在关注数据质量时, 如果仅仅要求前台的操作人员在输入数据时保持足够的细心,或要求销售人员在录入订单的客户和产品信息时保持足够的仔细显然都是不够的。我们还可以通过在数据的录入界面上附加更加严格的技术性约束来避免和修复数据的质量问题。这些方法提供了一些修复或避免数据质量问题的线索,但是在采取这些技术性措施之前,我们需要用一个更大的视野关注数据质量问题。例如:在一个零售银行,身份证号码是空白的或者是填入了一些垃圾...