基于粗集的数据挖掘在电子商务中的应用[摘要]电子商务是现代商业的主流趋势,基于数据挖掘技术可以充分利用企业的信息数据,从海量数据中挖掘出对企业有用的信息
文中主要介绍了基于粗糙集的数据挖掘过程:数据预处理、约简和规则提取
[关键词]电子商务粗集数据挖掘决策规则一、引言在当前信息化时代,世界电子商务发展速度非常快,传统行业的电子商务也得到了广泛的应用
在日益激烈的电子商务买方市场竞争中,任何与消费者行为有关的信息对商家来说都是非常宝贵的
虽然电子商务网站的后台数据库能够记录下来丰富的交易信息和顾客相关的数据,但是这些数据资源中所蕴涵的大量有益信息至今却未能得到充分地挖掘和利用
粗糙集作为一种新的数据挖掘的手段,在这一领域的应用有不错的前景
在数据挖掘的过程中,存在大量冗余数据影响我们的决策,粗糙集理论在得到的决策规则和推理过程方面是最有利的工具,它不但可以在不影响数据所表达的信息下使原来的数据量大为减少,而且可以产生决策规则,从而可以挖掘数据中的有效的模式
二、基于粗集的数据挖掘方法1
粗集的基本概念粗糙集(RoughSet,简称RS)理论由波兰逻辑学家Pawlak教授于1982年提出,由于它能有效处理不精确、不一致及不完整等不完备信息,并从中发现隐含的知识,揭示潜在的规律,近年来越来越多的研究人员开始对它进行研究,从理论上建立了Rough集理论的数据模型,还提出了很多算法,在机器学习、数据挖掘、人工神经网络等方面得到了广泛应用
粗糙集理论和数据挖掘关系密切,它为数据挖掘提供了一种新的方法和工具
在粗集理论中,“知识”被认为是一种将现实或抽象的对象进行分类的能力
关于U的一个知识库可以理解为一个关系系统,其中U为论域,R是U上的一簇等价关系
决策表信息系统又叫决策表,他是一类特殊而重要的知识表达系统,也是一种特殊的信息表,它表示当满足某些条件时决策(行为、操作、控制)应当如何