一 、 名 词 解 释 1
数 据 仓 库 : 是 一 种 新 的 数 据 处 理 体 系 结 构
是 面 向 主 题 的 、 集 成 的 、 不 可 更 新 的(稳 定 性 )、随 时 间 不 断 变 化 (不 同 时 间 )的 数 据 集 合
为 企 业 决 策 支 持 系 统 提 供 所需 的 集 成 信 息
孤 立 点 : 指 数 据 库 中 包 含 的 一 些 与 数 据 的 一 般 行 为 或 模 型 不 一 致 的 异 常 数 据
OLAP:OLAP 是 在 OLTP 的 基 础 上 发 展 起 来 的
以 数 据 仓 库 为 基 础 的 数 据 分 析 处 理
是 共 享 多 维 信 息 的 快 速 分 析
是 被 专 门 设 计 用 于 支 持 复 杂 的 分 析 操 作
侧 重 对 分析 人 员 和 高 层 管 理 人 员 的 决 策 支 持
粒 度 : 指 数 据 仓 库 的 数 据 单 位 中 保 存 数 据 细 化 或 综 合 程 度 的 级 别
粒 度 影 响 存放 在 数 据 仓 库 中 的 数 据 量 的 大 小
同 时 影 响 数 据 仓 库 所 能 回答查询问题 的 细 节程 度
数 据 规范化 : 指 将数 据 按比例缩放 (如更 换大 单 位 )
使之落入一 个特定 的 区域(如0-1)以 提 高 数 据 挖掘效率的 方法
规范化 的 常 用 方法有: 最大 -最小 规范化 、 零-均值规范化 、 小 数 定 标规范化
关联知识: 是 反映一 个事件和 其他事件之间 依赖或 相互关联的 知识
如果两项或 多 项属性 之间 存 在 关联
那么其中 一 项的 属性 值就可 以 依据 其他属性 值进行预测
数 据 挖掘: 从大 量 的 、