课 后 习 题 答 案 第 一 章 : 引 言 (Introdu ction) 1.4 数 据 仓 库 和 数 据 库 有 何 不 同 ? 有 哪 些 相 似 之 处 ? (How is a data w arehouse different from a database? How are they similar?)p8 答 : 区 别 : 数 据 仓 库 是 面 向 主 题 的 , 集 成 的 , 不 易 更 改 且 随 时 间 变 化 的 数 据 集 合 , 用 来支 持 管 理 人 员 的 决 策 ,数 据 库 由 一 组 内 部 相 关 的 数 据 和 一 组 管 理 和 存 取 数 据 的 软 件 程 序 组 成 ,是 面 向 操 作 型 的 数 据 库 , 是 组 成 数 据 仓 库 的 源 数 据 。 它 用 表 组 织 数 据 , 采 用 ER 数 据 模 型 。 相 似 : 它 们 都 为 数 据 挖 掘 提 供 了 源 数 据 , 都 是 数 据 的 组 合 。 第 二 章 : 数 据 预 处 理 (Data Preprocessing) 2.4 假 定 用 于 分 析 的 数 据 包 含 属 性 age。 数 据 元 组 的 age 值 ( 以 递 增 序 ) 是 : 13, 15,16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36,40, 45, 46, 52, 70。 (Suppose that the data for analysis includes the attribute age. The age values for the data tuples are (in increasing order) 13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45,46, 52, 70.) (a) 该 数 据 的 均 值 是 什 么 ? 中 位 数 是 什 么 ? (What is the mean of the data? What is the median?) 答 : 均 值=(13+15+16+16+19+20+20+21+22+22+25+25+25+25+30+33+33+35+35+35+35+36+40+45+46+52+70)/27=29.96 中 位 数 应 是 第 14个 ,即 x14=25=Q2。 (b) 该 数 据 的 众 数 是 什 么 ? 讨 论 数 据 的 峰 ( 即 双 峰 、 三 峰 等 ) 。 (What is the mode of the data? Comment on the data's modality (i.e., bimodal, trimodal, etc.).) 答 : 这 个 数 集 的 众 数 有 两 个...