Web 数据挖掘在电子商务的应用 1 电子商务中的数据挖掘简介 电子商务中的数据挖掘即 Web 挖掘,是利用数据挖掘技术从 www 的资源(即 Web 文档)和行为(即 Web 服务)中自动发现并提取感兴趣的、有用的模式和隐含的信息,它是一项综合技术,涉及到 Internet 技术学、人工智能等多个领域
当电子商务在企业中得到应用时,企业信息系统将产生大量数据,并且迫切需要将这些数据转换成有用的信息,为企业制造更多潜在的利润,数据挖掘概念就是从这样的商业角度开发出来的
2Web 数据挖掘的流程 Web 数据挖掘是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取商业决策的关键性数据,可以使企业把数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位
在电子商务环境下,Web 数据挖掘主要分为以下几步:(1)数据收集
首先数据收集主要针对 web 数据中的服务器数据、用户数据
其中服务器数据是 Web 挖掘中的主要对象
服务器中承载着用户访问时产生的对应的服务数据,其中包括了:日志文件、cookie 文件、数据流
将这些数据进行初步收集,再针对这些数据进行深度分析挖掘
(2)数据选择和预处理
通过数据收集将数据进行分类,根据所需的信息主题对收集的数据进行选择,通过选择相关的数据项缩小数据处理的范围,选择其中的有效数据进行数据预处理
数据预处理能够提高挖掘效率,为之后的数据分析提供有效的数据
Web 数据中大多数都是半结构或非结构化的,所以对web 数据进行直接处理是不可行的
数据预处理能够把半结构或非结构化的数据处理成标准的数据集方便后期处理
(3)模式发现
模式发现是运用各种方法,发现数据中隐藏的模式和规则
通过模式发现技术对预处理之后的数据进行处理得到相应的事务数据库,利用模式发现对数据进行初步挖掘,将预处理下的事务数据转换成可被挖掘的存储方