第1页共7页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共7页四川农业大学本科生毕业论文(设计)开题报告毕业论文(设计)题目邮政业务的交叉销售模型研究选题类型应用基础课题来源自选学院专业指导教师职称姓名年级学号一、立题依据1、国内外研究现状(1)数据挖掘的研究现状和发展态势数据挖掘是指从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘人们感兴趣知识的过程
其中知识表示为概念、规则、规律、模式等形式,它们是隐含的、事先未知的潜在有用信息,在商务数据深处蕴藏着未被发现的机会,可以用数据挖掘技术来发现
在交叉销售建模过程中,主要运用分类、聚类以及业务关联分析进行建模
①分类算法在分类算法中,决策树的应用十分普遍
它起源于概念学习系统,具有分类精度和效率较高、结果易于理解、能够导出分类规则等优点
决策树建模包括了建树和剪枝两个阶段
构造决策树算法有多种,较有代表性的有Quinlan的ID3算法、Breiman等人CART算法、Loh和Shih的QUEST算法、Magidson的CHAID算法;剪枝算法有Breiman的复杂-代价剪枝、Quinlan的减少错误的剪枝和悲观估计剪枝
关于决策树的规则提取研究包括Quinlan提出的直接由训练数据推导规则的方法、Clark提出的CN2规则推导算法、Smyt等提出ITRULE算法、Major和Mangano提出的规则精炼策略
除了决策树,支持向量机和朴素贝叶斯网络也是主要的分类算法
②聚类算法聚类分析算法最早是由Kaufman等提出的,探讨了聚类分析的单连接方法;Alfred进一步给出了单连接方法的通用公式;Aronis提出了著名的K-means算法;Chen提出了区分自然划分与分切的差异阵;Aronis开发了极大似然分类方法;Karypis提出了如何使用分枝定界思想来扩大穷举方法评估聚类使用范围,同时还讨论