1 数据挖掘概述 1.1 背景 1.2 数据挖掘定义 1.3 基本概念 1.4 主要功能 1.5 数据挖掘模型 1.6 实现流程 1.7 数据挖掘的应用 1.8 未来趋势 1 .1 背景 二十世纪末以来,全球信息量以惊人的速度急剧增长——据估计,每二十个月将增加一倍。许多组织机构的IT 系统中都收集了大量的数据(信息)。目前的数据库系统虽然可以高效地实现数据的录入、 查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,从而导致“数据爆炸但知识贫乏 ”的现象。为了充分利用现有信息资源,从海量数据中找出隐藏的知识,数据挖掘技术应运而生并显示出强大的生命力。 1989 年 8 月,在美国底特律召开的第 11 届国际人工智能联合会议(AAAI)的专题讨论会上首次出现数据库中的知识发现(Knowledge Discovery in Database,KDD)这一术语。 随后,在 1991 年、1993 年和 1994 年都举行 KDD 专题讨论会,汇集来自各个领域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算法、知识表示、知识运用等问题。1995 年在加拿大蒙特利尔召开了第一届 KDD 国际学术会议(KDD’95)。由 Kluwer Academic Publisher 出版,1997 年创刊的《Knowledge Discovery and Data Mining》是该领域中的第一本学术刊物。 最初,数据挖掘是作为 KDD 中利用算法处理数据的一个步骤,其后逐渐演变成 KDD 的同义词。现在,人们往往不加区别地使用两者。KDD 常常被称为数据挖掘(Data Mining),实际两者是有区别的。一般将 KDD 中进行知识学习的阶段称为数据挖掘(Data Mining),数据挖掘是 KDD 中一个非常重要的处理步骤,是 KDD 的核心过程。 数据挖掘是近年来出现的客户关系管理(Cu stomer Relationship Management, CRM)、商业智能(Bu siness Intelligence, BI)等热点领域的核心技术之一。 目前,关于 KDD 的研究工作已经被众多领域所关注,如过程控制、信息管理、商业、医疗、金融等领域。作为大规模数据库中先进的数据分析工具,KDD 的研究已经成为数据库及人工智能领域研究的一个热点。 数据挖掘是指从大型数据库中提取人们感兴趣的知识,这些知识是隐含的、事先不知的、潜在有用的信息。数据挖掘涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等各个领域,其目的在于从大量数据中发现隐含的、新的、令...