实验二-决策树实验-实验报告 实 验 二-决 策 树 实 验 -实 验 报 告 编 辑 整 理 : 尊 敬 的 读 者 朋 友 们 : 这 里 是 精 品 文 档 编 辑 中 心 , 本 文 档 内 容 是 由 我 和 我 的 同 事 精 心 编 辑 整 理 后 发 布 的 , 发 布 之 前 我 们 对文 中 内 容 进 行 仔 细 校 对 , 但 是 难 免 会 有 疏 漏 的 地 方 , 但 是 任 然 希 望 ( 实 验 二 -决 策 树 实 验 -实 验 报 告 )的 内 容 能 够 给 您 的 工 作 和 学 习 带 来 便 利 。同 时 也 真 诚 的 希 望 收 到 您 的 建 议 和 反 馈 , 这 将 是 我 们 进 步的 源 泉 , 前 进 的 动 力 。 本 文 可 编 辑 可 修 改 , 如 果 觉 得 对 您 有 帮 助 请 收 藏 以 便 随 时 查 阅 , 最 后 祝 您 生 活 愉 快 业 绩 进 步 , 以下 为 实 验 二 -决 策 树 实 验 -实 验 报 告 的 全 部 内 容 。 实验二-决策树实验-实验报告 决策树实验 一、实验原理 决策树是一个类似于流程图的树结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个测试输入,而每个树叶结点代表类或类分布.数的最顶层结点是根结点。一棵典型的决策树如图1 所示.它表示概念buys_computer,它预测顾客是否可能购买计算机。内部结点用矩形表示,而树叶结点用椭圆表示。为了对未知的样本分类,样本的属性值在决策树上测试。决策树从根到叶结点的一条路径就对应着一条合取规则,因此决策树容易转化成分类规则。 图1 ID3 算法: ■ 决策树中每一个非叶结点对应着一个非类别属性,树枝代表这个属性的值。一个叶结点代表从树根到叶结点之间的路径对应的记录所属的类别属性值。 ■ 每一个非叶结点都将与属性中具有最大信息量的非类别属性相关联. ■ 采用信息增益来选择能够最好地将样本分类的属性。 信息增益基于信息论中熵的概念。ID3 总是选择具有最高信息增益(或最大熵压缩)的属性作为当前结点的测试属性。该属性使得对结果划分中的样本分类所需的信息量最小,并反映划分的最小随机性或“不纯性"。 二、算法伪代码 实验二-决策树实验-实验报告 算法Decision_Tree(data,AttributeName) 输入由离散值属性描述的训练样本集data; 候选属性集合Attribut...