I 决策树是分类应用中采用最广泛的模型之一。与神经网络和贝叶斯方法相比,决策树无须花费大量的时间和进行上千次的迭代来训练模型,适用于大规模数据集,除了训练数据中的信息外不再需要其他额外信息,表现了很好的分类精确度。其核心问题是测试属性选择的策略,以及对决策树进行剪枝。连续属性离散化和对高维大规模数据降维,也是扩展决策树算法应用范围的关键技术。 本文以决策树为研究对象,主要研究内容有:首先介绍了数据挖掘的历史、现状、理论和过程,然后详细介绍了三种决策树算法,包括其概念、形式模型和优略性,并通过实例对其进行了分析研究 目 录 一、引言........................................................................................................................ 1 二、数据挖掘................................................................................................................ 2 (一)概念.................................................................................................................2 (二)数据挖掘的起源.............................................................................................2 (三)数据挖掘的对象.............................................................................................3 (四)数据挖掘的任务.............................................................................................3 (五)数据挖掘的过程.............................................................................................3 (六)数据挖掘的常用方法.....................................................................................3 (七)数据挖掘的应用.............................................................................................5 三、决策树算法介绍.................................................................................................... 5 (一)归纳学习.........................................................................................................5 (二)分类算法概述.................................................................................................5 (三)决策树学习算法..............................