2010年第4期福建教育学院学报随着网络技术的迅速发展和数据库技术的成熟,电子商务显示出巨大的市场价值和发展潜力
当企业采用电子商务时,迫切需要把企业信息系统产生的大量数据转换为有用的数据,为企业创造更大的财富
数据仓库和数据挖掘技术,可以使企业把数据转化为有用的信息并帮助决策,从而是企业在激烈的市场竞争中处于优势地位
一、数据仓库与数据挖掘1
数据仓库数据仓库是面向主题的(subject-oriented)、集成的(integrated)、非违约的(non-volatile)且时变的(time-variant)用于管理和决策制定的数据集
由此可见,数据仓库是一种分析型数据库,基于标准企业模型集成的、带有时间属性的、面向主题的数据集合,与传统支持查询为主的事务性操作数据库有着本质区别,具备以下四个特征:(1)面向主题主题是一个抽象的概念
基于主题组织的数据,根据领域的逻辑内涵,分为独立的领域,互不交叉,并形成相应的数据视图,汇总表等,因此适于联机分析处理(OLAP)
(2)集成化当数据从面向应用提取到数据仓库时,由于命名冲突、数据结构转换等的冲突,需要对原有数据进行抽取、清理、加工,形成一致的命名、变量度量、编码结构、物理属性等
(3)非违约性由于数据仓库中的数据是历史数据,当数据集成到数据仓库后,不需要更改
仅限于装数据和访问数据;并不存在数据恢复,数据同步,修复死锁等复杂问题
(4)时变性出于决策的需要,数据仓库中的数据需要标明时间参数,并随时间不断变化,即随着时间变化,不断有新的数据内容添加;不断导出和删除没用的数据内容;不断地重新综合数据
数据挖掘数据挖掘(DataMining)就是从大量的、不完全的、模糊的、有噪声的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等