数据挖掘简介数据挖掘简介:数据挖掘数据挖掘是采用数学、统计、人工智能和神经网络等领域的科学方法,从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,为商业智能系统服务的各业务领域提供预测性决策支持的方法、工具和过程
数据挖掘前身是知识发现,属于机器学习的范畴,所用技术和工具主要有统计分析或数据分析和知识发现
知识发现与数据挖掘是人工智能、机器学习与数据库技术相结合的产物,是从数据中发现有用知识的整个过程
机器学习是用计算机模拟人类学习的一门科学,由于在专家系统开发中存在知识获取的瓶颈现象,所以采用机器学习来完成知识的自动获取
数据挖掘是过程中的一个特定步骤,它用专门算法从数据中抽取模式
年,、和将过程定义为:从数据中鉴别出有效模式的非平凡过程,该模式是新的、可能有用的和最终可理解的;是从大量数据中提取出可信的、新颖的、有效的,并能被人理解的模式的处理过程,这种处理过程是一种高级的处理过程
数据挖掘则是按照既定的业务目标,对大量的企业数据进行探索,揭示隐藏其中的规律性,并进一步将其设计为先进的模型和有效的操作
在日常的数据库操作中,经常使用的是从数据库中抽取数据以生成一定格式的报表
与数据库报表工具的区别是:数据库报表制作工具是将数据库中的某些数据抽取出来,经过一些数学运算,最终以特定的格式呈现给用户;而则是对数据背后隐藏的特征和趋势进行分析,最终给出关于数据的总体特征和发展趋势
报表工具能制作出形如上学期考试未通过及成绩优秀的学生的有关情况的表格;但它不能回答考试未通过及成绩优秀的学生在某些方面有些什么不同的特征的问题,而就可以回答
具体来说,数据挖掘针对商业智能系统的大量的数据,运用记忆推理、聚类分析、关联分析、决策树、神经网络、基因算法等技术,对商业智能系统数据进行描述,以发现数据中隐藏的模式,并通过这些模