简介 本书完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展
本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了 OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域
本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材
序言 社会的计算机化显著地增强了我们产生和收集数据的能力
大量数据从我们生活的每 个角落涌出
存储的或瞬态的数据的爆炸性增长已激起对新技术和自动工具的需求,以帮助我们智能地将海量数据转换成有用的信息和知识
这导致称做数据挖掘的 一个计算机科学前沿学科的产生,这是一个充满希望和欣欣向荣并具有广泛应用的学科
数据挖掘通常又称为数据中的知识发现(KDD),是自动地或方便地提取 代表知识的模式;这些模式隐藏在大型数据库、数据仓库、Web、其他大量信息库或数据流中
本书考察知识发现和数据挖掘的基本概念和技术
作 为一个多学科领域,数据挖掘从多个学科汲取营养
这些学科包括统计学、机器学习、模式识别、数据库技术、信息检索、网络科学、知识库系统、人工智能、高性 能计算和数据可视化
我们提供发现隐藏在大型数据集中的模式的技术,关注可行性、有用性、有效性和可伸缩性问题
因此,本书不打算作为数据库系统、机器学 习、统计学或其他某领域的导论,尽管我们确实提供了这些领域的必要背景材料,以便读者理解它们各自在数据挖掘中的作用
本书是对数据挖掘的全面介绍
对于 计算科学的学生、应用开发人员、行业专业人员以及涉及以上列举的学科的研究人员,本书应当是有用的
数据挖掘出现于 20世纪80年代后 期,20世纪90年代有了突飞猛进的发展,并可望在新千年继续