更多企业学院:《中小企业管理全能版》套讲座份资料《总经理、高层管理》套讲座份资料《中层管理学院》套讲座份资料《国学智慧、易经》套讲座《人力资源学院》套讲座份资料《各阶段员工培训学院》套讲座份资料《员工管理企业学院》套讲座份资料《工厂生产管理学院》套讲座份资料《财务管理学院》套讲座份资料《销售经理学院》套讲座份资料《销售人员培训学院》套讲座份资料试卷代号:卷浙江广播电视大学年月期末考试试题《数据挖掘与客户管理》期末考试试卷(试卷总分:分,考试时间:分钟)题号一二三四总分分数一、名词解释(每题分,共分).数据挖掘:.过度拟合:.过抽样:.辛普森差异系数(基尼系数):.数据仓库:二、填空题(每空分,共分).数据挖掘的三大支柱分别是、和。.互动循环过程有四个业务过程,这四个过程循环往复,分别是理解业务问题、将数据转换成可执行的决策、和。.预测模型成功应用的三个假定分别是、和。.数据仓库的优点是和。.数据仓库可由多个数据中心构成,数据仓库设计者们安排好这些数据中心的最主要挑战是要建立合适的。.使用无监督的数据挖掘方法必须。.为了确保输入数据早于输出结果,可以用方法对数据时间元素进行处理。.分段输入组合模型和模型分段组合模型的最大区别在于。.客户流失的原因,大致可以分为两类:自愿流失和。三、单项选择题(每题分,共分).企业所建立的预测模型的好坏取决于模型在()上的表现效果。得分集训练集测试集评价集.客户在经济活动中具有多重身份,下面哪一种不是其身份之一()。行为身份所有权身份学习身份决策身份.下列四条描述中,正确的一条是()。企业实施数据挖掘,必须要有数据仓库。企业要实施数据挖掘最好的方式是请编外专家。企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合。在建模的时侯,增益最高的模型就是最好的模型。.数据挖掘算法以()形式来组织数据。行列记录表格.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是()。数据越多越好。尽可能多的适合的数据。得分集数据是建模集数据的一部分。以上三条都正确。.—均值类别侦测要求输入的数据类型必须是()。整型数值型字符型逻辑型.在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益图上的()相对应。线段长度线段斜率相对应的线段长度相对应的线段斜率.企业为提升每个客户的价值,应实现()最优化。促销活动预算最优化客户最优化三者都不是.数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了()数据挖掘方法。分类预测组合或关联法则聚类.企业成功实施数据挖掘,需要以下()知识或技术预先的规划对商业文体的理解综合商业知识和技能都需要四、简答题(每题分,共分).数据挖掘的六种常用算法和技术分别是什么?.实现数据挖掘技术在企业中专业化应用的四种有效途径?.一般认为有哪几种方法可以提升客户的价值?.数据挖掘中的数据需要采用哪些格式?.预测模型的建立过程有哪些?《数据挖掘与客户管理》期末考试试卷答案(试卷总分:分,考试时间:分钟)一、名词解释(每题分,共分).数据挖掘:是通过自动或半自动化的工具对大量的数据进行探索和分析的过程,其目的就是发现其中有意义的模式和规律。.过度拟合:预测模型对训练集和测试集的模式记忆太深,而不能很好地、一般化地对未来数据进行预测。.过抽样:多抽取稀有事件,少抽取常见结果,以建立模型集的过程。目的是调整模型集中稀疏数据与一般数据间的比例关系,使之保持在..辛普森差异系数(基尼系数):衡量度量总体的差异程度。解释为从总体中有放回地随机取得两个样品属于不同类别的概率。公式为:××(-),其中是属于第一类的概率。.数据仓库:是从关系型数据库中发展起来的,是一个面向主题的、集成的、反映历史变化的和相对稳定的数据集合。二、填空题(每空分,共分).数据挖掘技术与算法、无所不在的数据、建立有效的预测模型.决策实施、评价决策模型.过去是将来的预言家、数据是可以获得的、数据中应包括我们的预期目标.数据仓库是从一个点上观察整个企业,而不...