1 数据挖掘概述 1
1 背景 1
2 数据挖掘定义 1
3 基本概念 1
4 主要功能 1
5 数据挖掘模型 1
6 实现流程 1
7 数据挖掘的应用 1
8 未来趋势 1
1 背景 二十世纪末以来,全球信息量以惊人的速度急剧增长——据估计,每二十个月将增加一倍
许多组织机构的IT 系统中都收集了大量的数据(信息)
目前的数据库系统虽然可以高效地实现数据的录入、 查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,从而导致“数据爆炸但知识贫乏 ”的现象
为了充分利用现有信息资源,从海量数据中找出隐藏的知识,数据挖掘技术应运而生并显示出强大的生命力
1989 年 8 月,在美国底特律召开的第 11 届国际人工智能联合会议(AAAI)的专题讨论会上首次出现数据库中的知识发现(Knowledge Discovery in Database,KDD)这一术语
随后,在 1991 年、1993 年和 1994 年都举行 KDD 专题讨论会,汇集来自各个领域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算法、知识表示、知识运用等问题
1995 年在加拿大蒙特利尔召开了第一届 KDD 国际学术会议(KDD’95)
由 Kluwer Academic Publisher 出版,1997 年创刊的《Knowledge Discovery and Data Mining》是该领域中的第一本学术刊物
最初,数据挖掘是作为 KDD 中利用算法处理数据的一个步骤,其后逐渐演变成 KDD 的同义词
现在,人们往往不加区别地使用两者
KDD 常常被称为数据挖掘(Data Mining),实际两者是有区别的
一般将 KDD 中进行知识学习的阶段称为数据挖掘(Data Mining),数据挖掘是 KDD 中一个非常重要的处理步骤,是 KDD 的核心过程