动词决策树程序的部分说明数据的处理:把决策树变为动词决策树决策树中 户外={晴天,阴天,雨天}=>1={1,2,3},则在动词决策树中 户外={晴天 到 晴天,晴天 到 阴天,晴天 到 雨天,阴天 到 晴天,阴天 到 阴天,阴天 到 雨天,雨天 到 晴天,雨天 到 阴天,雨天 到 雨天}={1,2,3,4,5,6,7,8,9} A 到 B 的属性值为 N*(A-1)+B,N 为属性的属性值的个数,如户外中的“晴天 到 阴天”即 1 到 2,所以它的属性值为 3*(1-1)+2=2。各属性值的标准值如表一户外温度湿度风速活动晴天=8炎热=35高=8弱=4取消=1阴天=5温柔=25正常=6强=9进行=2雨天=2凉爽=16表一TEMP 的值如表二表二TEMP 的值中的每列代表一个模板,如第八列为(8,-3)其中 8 为 x0,-3 为△x,它是户外中“晴天 到 阴天”的模板。如图一图一图一动词决策树中采集的数据如表三表三中的兰色数字表示所在列的属性,蓝色数字表示所在列的属性的属性值的个数 。DATA 的值如表四1 25 3 4 5D1 6 点8 35 8 4 1 14 点 8 35 8 4 1 D2 6 点8 35 8 9 1 14 点 8 35 8 9 1D3 6 点5 35 8 4 2 14 点 5 35 8 4 2D4 6 点2 25 8 4 214 点 2 25 8 4 2D5 6 点2 16 6 4 214 点 2 16 6 4 2D6 6 点2 16 6 9 114 点 2 16 6 9 1D7 6 点5 16 6 9 214 点 5 16 6 9 2D8 6 点8 25 8 4 114 点 8 25 8 4 1D9 6 点8 16 6 4 214 点 8 16 6 4 2D10 6 点 2 25 6 4 214 点 2 25 6 4 2D11 6 点 8 25 6 9 214 点 8 25 6 9 2D12 6 点 5 25 8 9 214 点 5 25 8 9 2D13 6 点 5 35 6 4 214 点 5 35 6 4 2D14 6 点 2 25 8 9 114 点 2 25 8 9 19 95 4 4 4 表三 SDATA 为采集的数据与相应的模板的相似度,它对应的程序为:[SDATA]=DATATOSDATA(DATA,TEMP)。由程序我们可得图二到图四,这些数据与根节点有关。图二到图四中的 gain 行表示 the verb information gain,gain 行中的值应该为负,也就是0.4198 应为-0.4198其中-0.4198=-(0.9622+0.2265+0.0200+0.2118+0.9371+0.2118+0.0200+0.2265+0.9622)/9由图二到图四中的数据可得,the verb information gain 的最大值为-0.3017,即根节点为温度。这与决策树所得的根节点不同,决策树的根节点是户外。即动词决策树与决策树所求的结果不同。原因可能是动词决策树中的 the verb information gain 与目标结果无关,只有叶节点中的S+,S-与目标结果有关。而决策树中的 the information gain 与目标结果有关。 表四图二图三图四ID3 程序的流程图的更正: