朱 明 浩 制 作 2015/11/24 1 一 、 名 词 解 释 1 . 数 据 仓 库 : 是 一 种 新 的 数 据 处 理 体 系 结 构 , 是 面 向 主 题 的 、 集 成 的 、 不 可 更 新的 (稳 定 性 )、 随 时 间 不 断 变 化 (不 同 时 间 )的 数 据 集 合 , 为 企 业 决 策 支 持 系 统 提供 所 需 的 集 成 信 息 。 2 . 孤 立 点 : 指 数 据 库 中 包 含 的 一 些 与 数 据 的 一 般 行 为 或 模 型 不 一 致 的 异 常 数 据 。 3 . OLAP: OLAP 是 在 OLTP 的 基 础 上 发 展 起 来 的 , 以 数 据 仓 库 为 基 础 的 数 据 分 析 处理 , 是 共 享 多 维 信 息 的 快 速 分 析 , 是 被 专 门 设 计 用 于 支 持 复 杂 的 分 析 操 作 , 侧重 对 分 析 人 员 和 高 层 管 理 人 员 的 决 策 支 持 。 4 . 粒 度 : 指 数 据 仓 库 的 数 据 单 位 中 保 存 数 据 细 化 或 综 合 程 度 的 级 别 。 粒 度 影 响 存放在 数 据 仓 库 中 的 数 据 量的 大小, 同 时 影 响 数 据 仓 库 所 能回答查询问题 的 细 节程 度 。 5 . 数 据 规范化 : 指 将数 据 按比例缩放(如更 换大单 位 ), 使之落入一 个特定 的 区域(如0-1)以 提 高 数 据 挖掘效率的 方法。 规范化 的 常 用 方法有: 最大-最小规范化 、 零-均值规范化 、 小数 定 标规范化 。 6 . 关联知识: 是 反映一 个事件和 其他事件之间 依赖或 相互关联的 知识。 如果两项或 多 项属性 之间 存 在 关联, 那么其中 一 项的 属性 值就可 以 依据 其他属性 值进行预测。 7 . 数 据 挖掘: 从大量的 、 不 完全的 、 有噪声的 、 模 糊的 、 随 机的 数 据 中 , 提 取隐含 在 其中 的 、 人 们事先不 知道的 、 但又是 潜在 有用 的 信 息 和 知识的 过程 。 8 . OLTP: OLTP 为 联机事务处 理 的 缩写, OLAP 是 联机分 析 处 理 的 缩写。 前者是 以 数据 库 为 基 础 的 , 面 对 的 是 操 作 人 员 和 低层 管 理 人 员 , 对 基 本数 据 进行 查询...