实验三 决策树算法实验 一、实验目的: 熟悉和掌握决策树的分类原理、实质和过程;掌握典型的学习算法 和实现技术。 二、实验原理: 决策树学习和分类. 三、实验条件: 四、实验内容: 1 根据现实生活中的原型自己创建一个简单的决策树。 2 要求用这个决策树能解决实际分类决策问题。 五、实验步骤: 1、验证性实验: (1)算法伪代码 算法 Decision_Tree(data,Attribu teName) 输入由离散值属性描述的训练样本集 data; 候选属性集合 Attribu teName。 输出一棵决策树。 (1) 创建节点 N; (2) If samples 都在同一类 C 中 then (3) 返回 N 作为叶节点,以类 C 标记; (4) If attribu te_list 为空 then (5) 返回 N 作为叶节点,以 samples 中最普遍的类标记;//多数表决 (6) 选择 attribu te_list 中具有最高信息增益的属性 test_attribu te; (7) 以 test_attribu te 标记节点 N; (8) For each test_attribu te 的已知值 v //划分 samples ; (9) 由节点 N 分出一个对应 test_attribu te=v 的分支; (10 令 Sv 为 samples 中 test_attribu te=v 的样本集合;//一个划分块 (11)If Sv 为空 then (12)加上一个叶节点,以 samples 中最普遍的类标记; (13)Else 加入一个由 Decision_Tree(Sv ,attribu te_list-test_attribu te)返回节点值。 (2)实验数据预处理 Age:30 岁以下标记为“1”;30 岁以上50 岁以下标记为“2”;50 岁以上标记为“3”。 Sex:FEMAL----“1”;MALE----“2” Region:INNER CITY----“1”;TOWN----“2”; RURAL----“3”; SUBURBAN----“4” Income:5000~2 万----“1”;2 万~4 万----“2”;4 万以上----“3” Married Children Car Mortgage Pep:以上五个条件,若为“是”标记为“1”,若为“否”标记为“2”。 Age sex region income married children car mortgage pep 1 2 1 1 2 1 1 2 2 1 2 1 1 2 2 2 2 1 2 1 4 1 2 1 2 2 1 2 1 1 1 1 2 2 2 2 1 2 1 1 1 2 2 2 2 1 2 1 1 2 1 2 1 1 2 1 2 1 1 2 1 1 2 2 1 1 1 2 1 1 2 1 2 1 3 1 2 2 1 2 1 2 1 2 2 2 1 2 2 2 2 2 1 2 2 2 2 1 1 2 1 2 2 1 1 2 1 1 2 2 1 2 1 2 2 1 ...