朱 明 浩 制 作 2015/11/24 1 一 、 名 词 解 释 1
数 据 仓 库 : 是 一 种 新 的 数 据 处 理 体 系 结 构 , 是 面 向 主 题 的 、 集 成 的 、 不 可 更 新的 (稳 定 性 )、 随 时 间 不 断 变 化 (不 同 时 间 )的 数 据 集 合 , 为 企 业 决 策 支 持 系 统 提供 所 需 的 集 成 信 息
孤 立 点 : 指 数 据 库 中 包 含 的 一 些 与 数 据 的 一 般 行 为 或 模 型 不 一 致 的 异 常 数 据
OLAP: OLAP 是 在 OLTP 的 基 础 上 发 展 起 来 的 , 以 数 据 仓 库 为 基 础 的 数 据 分 析 处理 , 是 共 享 多 维 信 息 的 快 速 分 析 , 是 被 专 门 设 计 用 于 支 持 复 杂 的 分 析 操 作 , 侧重 对 分 析 人 员 和 高 层 管 理 人 员 的 决 策 支 持
粒 度 : 指 数 据 仓 库 的 数 据 单 位 中 保 存 数 据 细 化 或 综 合 程 度 的 级 别
粒 度 影 响 存放在 数 据 仓 库 中 的 数 据 量的 大小, 同 时 影 响 数 据 仓 库 所 能回答查询问题 的 细 节程 度
数 据 规范化 : 指 将数 据 按比例缩放(如更 换大单 位 ), 使之落入一 个特定 的 区域(如0-1)以 提 高 数 据 挖掘效率的 方法
规范化 的 常 用 方法有: 最大-最小规范化 、 零-均值规范化 、 小数 定 标规范化
关联知识: 是 反映一 个事件和 其他事件之间 依赖或 相互关联的 知识
如果两项或 多 项属性 之间 存 在 关联, 那么其中 一 项的 属性 值就可 以 依据 其他属性 值进行预测