数据挖掘中的软计算方法及应用综述摘要文章对数据挖掘中软计算方法及应用作了综述
对模糊逻辑、遗传算法、神经网络、粗集等软计算方法,以及它们的混合算法的特点进行了分析,并对它们在数据挖掘中的应用进行了分类
关键词数据挖掘;软计算;模糊逻辑;遗传算法;神经网络;粗集1引言在过去的数十年中,随着计算机软件和硬件的发展,我们产生和收集数据的能力已经迅速提高
许多领域的大量数据集中或分布的存储在数据库中[1][2],这些领域包括商业、金融投资业、生产制造业、医疗卫生、科学研究,以及全球信息系统的万维网
数据存储量的增长速度是惊人的
大量的、未加工的数据很难直接产生效益
这些数据的真正价值在于从中找出有用的信息以供决策支持
在许多领域,数据分析都采用传统的手工处理方法
一些分析软件在统计技术的帮助下可将数据汇总,并生成报表
随着数据量和多维数据的进一步增加,高达109的数据库和103的多维数据库已越来越普遍
没有强有力的工具,理解它们已经远远超出了人的能力
所有这些显示我们需要智能的数据分析工具,从大量的数据中发现有用的知识
数据挖掘技术应运而生
数据挖掘就是指从数据库中发现知识的过程
包括存储和处理数据,选择处理大量数据集的算法、解释结果、使结果可视化
整个过程中支持人机交互的模式[3]
数据挖掘从许多交叉学科中得到发展,并有很好的前景
这些学科包括数据库技术、机器学习、人工智能、模式识别、统计学、模糊推理、专家系统、数据可视化、空间数据分析和高性能计算等
数据挖掘综合以上领域的理论、算法和方法,已成功应用在超市、金融、银行[4]、生产企业[5]和电信,并有很好的表现
软计算是能够处理现实环境中一种或多种复杂信息的方法集合
软计算的指导原则是开发利用那些不精确性、不确定性和部分真实数据的容忍技术,以获得易处理、鲁棒性好、低求解成本和更好地与实际融合的性能
通常,软计算试图寻找对精确的或