数据挖掘在商业领域的运用 1 数据挖掘的过程 数据挖掘的过程可以理解为以下几个步骤。第一步,数据清理,解决数据的不一致问题、平滑噪声、补充缺失数据、识别并删除离群点。第二步,数据集成,把来自多个文件、数据立方或者数据库中的数据组合在一起。第三步,数据选择、分析、提取数据库中与任务相关的数据。第四步,数据变换,通过数据平滑、汇总、聚集、泛化、法律规范化、属性构造等操作提高对高维数据的理解,把数据变换统一成适合进行数据挖掘的形式。第五步,数据挖掘,选择合适的数据挖掘算法智能的提取出有用的信息或模式。数据挖掘在于发现有价值的模式,总体来说,数据挖掘的目的可以分为两类:描述性和预测性。描述性挖掘任务用于表示目标数据中数据的一般性质,包括分类、聚类、关联分析、异常检测等,预测性任务在汇总后的数据上进行归纳,作出预测,包括回归、分类等。第六步,模式评估,根据某种度量确定出某些有趣的模式,或由专家来评定其价值和正确性。第七步,知识表示,使用可视化等信息表示方法,向用户展示挖掘出的有用信息和结果分析。以上的步骤是进行数据挖掘的一般过程,对于不同的应用分析过程也不尽相同,在商业领域中,面对来自商业的各种不同的分析任务,首先应该理解该应用领域,对数据分析的背景有一个很好的理解,然后尽可能的根据所需信息进行信息的收集工作。 2 数据挖掘在商业领域中的重要应用及分析 零售业是非常适合的数据挖掘的商业领域之一,因为它包含了大量的销售记录、顾客购买记录、货物运输记录等大量的原始信息,为数据挖掘提供了丰富的资源。分类和预测技术在市场分析、供应和销售方面为商务智能提供预测分析;聚类可以在客户关系管理方面,根据顾客的相似性把顾客进行分组以便进行更多的后续分析。数据挖掘在商业上的应用具体在以下几个方面:第一,帮助设计和构造数据仓库,由于商业领域中信息范围太大,数据库的设计也存在许多方式,我们可以使用数据挖掘演练结果指导数据库的设计方便以后的使用和后续分析处理。第二,对顾客需求、产品销售、趋势等构造复杂的数据立方体,提供多维分析和可视化工具。第三,根据顾客购买记录,使用序列模式挖掘顾客的消费变化,分析顾客的忠诚程度。第四,产品推举和商品的交叉推举,通过销售记录挖掘关联信息,这类信息可以形成产品推举,也可以根据其他顾客的购买意愿产生个性化购买服务。第五,通过多维分析、聚类分析和林群点分析可以识别可能的欺...