数 据 质 量 诊 断 实 务 最 近 , “ 数 据 经 营 ” 逐 渐 成 为 热 点 话 题 , 在 大 数 据 市 场 中 , 数 据 质 量 自 然 而然 地 吸 引 了 很 多 人 的 注 意 。 这 里 所 谓 的 数 据 经 营 , 就 是 将 在 社 会 或 企 业 中 产 生 的大 量 数 据 加 工 为 有 价 值 的 数 据 , 利 用 他 们 对 企 业 利 润 甚 至 更 深 一 层 的 人 类 发 展 产生 重 大 意 义 。 从 2000 年 引 入 以 来 , 企 业 的 互 联 网 和 IT 技 术 就 飞 速 发 展 , 开 始 将企 业 的 所 有 业 务 信 息 化 。 在 企 业 层 面 , 导 入 了 用 来 统 一 数 据 的 数 据 仓 库 ( data warehouse) 及 商 务 智 能 ( business intelligence) 。 但 是 随 着 环 境 急 剧 变 化 ,准 备 却 不 充 分 ( 特 指 先 进 技 术 的 跟 进 ) , 将 不 同 业 务 中 到 处分 散的 信 息 系统 整合为 一 , 由此开 始 产 生 不 良数 据 。这 样的 不 良数 据 引 发 了 不 同 业 务 信 息 系统 间严重的 数 据 重 复和 不 一 致等问题 ,给企 业 带来 了 巨大 损失。存在 这 种问题 的 数 据 如果在 企 业 运营 中 持续使用 , 损害规模逐 渐 扩大 只 是 时 间问题 。 数 据 质 量 是 指 使用 的 数 据 是 否 达 到 适 当 的 标 准 以 上 。 举 个 简 单 的 例 子 , 假 设在 线 购 物 中 有 个 存储 卖 家 信 息 的 表SELLER INFO。 顾 客 可 以 看 到 卖 家 的 信 用 度 和配 送 所 需 时 间等, 进 而 购 买 卖 家 的 商 品 。 如果信 息 不 正 确 , 那 么 顾 客 对 于 表SELLER_INFO的 满 意 度 就 会 大 幅 下 降 。 相 反 , 根 据 SELLER_INFO 中 存储 的 数 据 成功 购 买 了 商 品 , 估 计 对 于 质 量 的 满 意 度 就 会 上 升 。 像 这 样的 数 据 质 量 , 就 意 味 着公 司 职 员 或 顾 客 使用 了 数 据 库 表 中 存储 的 数 据 , 所 得 到 的 产 品 满 意 度 标 准 ...