决策树程序实验VIP免费

下载本文档

阅读 174
下载 13
格式 pdf
大小 680.09 KB
约18页
2024-11-30 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/18页

2/18页

3/18页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/18

文本预览下载提示常见问题

决策树程序实验众所周知，数据库技术从20 世纪80 年代开始，已经得到广泛的普及和应用。随着数据库容量的膨胀，特别是数据仓库以及web 等新型数据源的日益普及，人们面临的主要问题不再是缺乏足够的信息可以使用，而是面对浩瀚的数据海洋如何有效地利用这些数据。从数据中生成分类器的一个特别有效的方法是生成一个决策树（Decision Tree）。决策树表示方法是应用最广泛的逻辑方法之一，它从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。决策树分类方法采用自顶向下的递归方式，在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支，在决策树的叶结点得到结论。所以从决策树的根到叶结点的一条路径就对应着一条合取规则，整棵决策树就对应着一组析取表达式规则。决策树是应用非常广泛的分类方法，目前有多种决策树方法，如ID3、CN2、SLIQ、SPRINT 等。一、问题描述 1.1 相关信息决策树是一个类似于流程图的树结构，其中每个内部结点表示在一个属性上的测试，每个分支代表一个测试输入，而每个树叶结点代表类或类分布。数的最顶层结点是根结点。一棵典型的决策树如图 1 所示。它表示概念 buys_computer，它预测顾客是否可能购买计算机。内部结点用矩形表示，而树叶结点用椭圆表示。为了对未知的样本分类，样本的属性值在决策树上测试。决策树从根到叶结点的一条路径就对应着一条合取规则，因此决策树容易转化成分类规则。图 1 ID3 算法： ■ 决策树中每一个非叶结点对应着一个非类别属性，树枝代表这个属性的值。一个叶结点代表从树根到叶结点之间的路径对应的记录所属的类别属性值。 ■ 每一个非叶结点都将与属性中具有最大信息量的非类别属性相关联。 ■ 采用信息增益来选择能够最好地将样本分类的属性。信息增益基于信息论中熵的概念。ID3 总是选择具有最高信息增益（或最大熵压缩）的属性作为当前结点的测试属性。该属性使得对结果划分中的样本分类所需的信息量最小，并反映划分的最小随机性或“不纯性”。 1.2 问题重述 1、目标概念为“寿险促销” 2、计算每个属性的信息增益 3、确定根节点的测试属性模型求解构造决策树的方法是采用自上而下的递归构造，其思路是： ■ 以代表训练样本的单个结点开始建树（步骤1）。 ■ ...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

决策树程序实验

决策树程序实验众所周知，数据库技术从20 世纪80 年代开始，已经得到广泛的普及和应用

随着数据库容量的膨胀，特别是数据仓库以及web 等新型数据源的日益普及，人们面临的主要问题不再是缺乏足够的信息可以使用，而是面对浩瀚的数据海洋如何有效地利用这些数据

从数据中生成分类器的一个特别有效的方法是生成一个决策树（Decision Tree）

决策树表示方法是应用最广泛的逻辑方法之一，它从一组无次序、无规则的事例中推理出决策树表示形式的分类规则

决策树分类方法采用自顶向下的递归方式，在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支，在决策树的叶结点得到结论

所以从决策树的根到叶结点的一条路径就对应着一条合取规则，整棵决策树就对应着一组析取表达式规则

决策树是应用非常广泛的分类方法，目前有多种决策树方法，如ID3、CN2、SLIQ、SPRINT 等

一、问题描述 1

1 相关信息决策树是一个类似于流程图的树结构，其中每个内部结点表示在一个属性上的测试，每个分支代表一个测试输入，而每个树叶结点代表类或类分布

数的最顶层结点是根结点

一棵典型的决策树如图 1 所示

它表示概念 buys_computer，它预测顾客是否可能购买计算机

内部结点用矩形表示，而树叶结点用椭圆表示

为了对未知的样本分类，样本的属性值在决策树上测试

决策树从根到叶结点的一条路径就对应着一条合取规则，因此决策树容易转化成分类规则

图 1 ID3 算法： ■ 决策树中每一个非叶结点对应着一个非类别属性，树枝代表这个属性的值

一个叶结点代表从树根到叶结点之间的路径对应的记录所属的类别属性值

■ 每一个非叶结点都将与属性中具有最大信息量的非类别属性相关联

小辰9 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

决策树程序实验VIP免费

决策树程序实验

您可能关注的文档

相关文档

热门下载

相关标签