数据挖掘在电子商务中的应用 1 数据挖掘的概念及其过程 1
1 数据挖掘 数据挖掘,即在数据库中的信息觉察,是指在大量的、不完好的、模糊的、有噪音的和随机的数据中,提取出潜在的、不为人知的、同时又是特别有用的学问和信息的过程
数据挖掘是一项应用技术广泛的交叉学科,它聚集了众多不同领域的学问,例如人工智能、可视化、数据库、数理统计等
从始至终数据挖掘技术都是面对应用领域,不仅是对于特定数据库的简洁检索查询,还包括对数据的不同层面、不同角度的统计、分析、推理和综合,以此得到问题的求解,以及觉察事件之间的联系,还有对未发生活动的预报
另外数据挖掘技术在存在大量数据积累的电子商务行业有着广泛的应用,是现代商务企业进展的不二选择
2 数据挖掘的过程 1
1 数据预处理 在实际状况中,企业获得的数据具有不完好性、模糊性和冗余性,所以数据挖掘技术针对的不是已得到的数据,而是潜在的数据信息,并通过预处理技术获得简洁、精确的数据
预处理的工作分为三步,数据合并、数据选择和数据清洗
先将多个数据库和文件中的数据进行合并,然后选择适合分析的数据信息集合,最终剔除无关记录,并将各个文件转换成方便数据挖掘的格式
2 模式觉察 这个阶段就是利用挖掘计算技术挖掘出有用的、潜在的、新颖的、可以理解的学问和信息
像关联分析、聚类分析、路径选择、序列分析等都可以用于 Web 的挖掘技术
3 模式分析 这个阶段是将模式觉察中没有用的模式和规则过滤掉
通过技术分析,得到有效的结论
常用关联规则、序列等手段
2 数据挖掘技术的方法 2
1 关联分析 所谓的关联分析,就是利用数据间相互关联的规则进行数据挖掘,为的是挖掘数据间潜在的联系规则
比方,在进行关联分析时,能觉察类似哪些产品更受客户的欢迎、为什么、产品优势有哪些、有多少客户会再次购置等问题
2 序列模式分析 这个过程和第一