-122- 第 十 章 数 据 的 统 计 描 述 和 分 析 数 理 统 计 研 究 的 对 象 是 受 随 机 因 素 影 响 的 数 据 , 以 下 数 理 统 计 就 简 称 统 计 , 统 计 是以 概 率 论 为 基 础 的 一 门 应 用 学 科 。 数 据 样 本 少 则 几 个 , 多 则 成 千 上 万 , 人 们 希 望 能 用 少 数 几 个 包 含 其 最 多 相 关 信 息 的数 值 来 体 现 数 据 样 本 总 体 的 规 律 。 描 述 性 统 计 就 是 搜 集 、 整 理 、 加 工 和 分 析 统 计 数 据 ,使 之 系 统 化 、 条 理 化 , 以 显 示 出 数 据 资 料 的 趋 势 、 特 征 和 数 量 关 系 。 它 是 统 计 推 断 的 基础 , 实 用 性 较 强 , 在 统 计 工 作 中 经 常 使 用 。 面 对 一 批 数 据 如 何 进 行 描 述 与 分 析 ,需 要 掌 握 参 数 估 计 和 假 设 检 验 这 两 个 数 理 统 计的 最 基 本 方法。 我们 将用 Matlab 的 统 计 工 具箱(Statistics Toolbox )来 实 现 数 据 的 统 计 描 述 和 分 析 。 §1 统 计 的 基 本 概 念 1 .1 总 体 和 样 本 总 体 是 人 们 研 究 对 象 的 全体 , 又称 母体 , 如 工 厂一 天生产的 全部产品(按合格品及废品分 类), 学 校全体 学 生的 身高。 总 体 中 的 每一 个 基 本 单位称 为 个 体 , 个 体 的 特 征 用 一 个 变量 (如 x )来 表 示 , 如 一件 产品是 合格品记0x, 是 废品记1x; 一 个 身高170(cm)的 学 生记170x。 从 总 体 中 随 机 产生的 若 干 个 个 体 的 集 合称 为 样 本 , 或 子 样 , 如 n 件 产品, 100 名 学生的 身高, 或 者 一 根 轴 直 径 的 10 次 测 量 。 实 际 上 这 就 是 从 总 体 中 随 机 取 得 的 一 批 数 据 ,不 妨 记 作nxxx,,,21, n 称 为 样 本 容 量 。 简 单地 说 , 统 计 的 任 务 是 由 样 本 推 断 总 体 。 1 .2 频 数 表 和 直 方图 一 组 数 据 (样 本 )往 往 是 杂 乱 无 章 的 ,...