大数据背景下统计学专业“数据挖掘”课程的教学探讨范彩云摘 要:互联网技术、物联网技术、云计算技术的蓬勃进展,造就了一个崭新的大数据时代,这些变化对统计学专业人才培育模式的变革起到了助推器的作用,而数据挖掘作为拓展和提升大数据分析方法与思路的应用型课程,被广泛纳入统计学本科专业人才培育方案。本文基于数据挖掘课程的特点,结合实际教学经验,对统计学本科专业开设数据挖掘课程进行教学探讨,以期达到更好的教学效果。关键词:统计学专业;数据挖掘;大数据;教学一、引言通常人们总结大数据有“4V”的特點:Volume(体量大),Variety(多样性),Velocity(速度快)和Value(价值密度低)。从这样大量、多样化的数据中挖掘和发现内在的价值,是这个时代带给我们的机遇与挑战,同时对数据分析技术的要求也相应提高。传统教学模式并不能适应和满足学生了解数据处理和分析最新技术与方法的迫切需要。对于常常和数据打交道的统计学专业的学生来说,更是如此。二、课程教学探讨针对统计学本科专业的学生而言,“数据挖掘”课程一般在他们三年级或者四年级所开设,他们在前期已经学习完统计学、应用回归分析、多元统计分析、时间序列分析等课程,所以在“数据挖掘”课程的教学内容选择上要有所取舍,同时把握好难度。不能把“数据挖掘”课程涵盖了的所有内容不加选择地要求学生全部掌握, 对学生来说是不太现实的,需要为统计学专业本科生 “个性化定制”教学内容。(1)“数据挖掘”课程的教学应该偏重于应用,更注重培育学生解决问题的能力。因此 ,教学目标应该是:使学生树立数据挖掘的思维体系,掌握数据挖掘的基本方法,提高学生的实际动手能力,为在大数据时代,进一步学习各种数据处理和定量分析工具打下必要的基础。根据这个目标,教学内容应以数据挖掘技术的基本原理讲解为主,让学生了解和掌握各种技术和方法的来龙去脉、功能及优缺点 ;以算法讲解为辅,由于有 R 语言、python 等软件, 学生了解典型的算法,能用软件把算法实现,对软件的计算结果熟练解读, 对各种算法的改进和深化讨论则不作要求,有兴趣的同学可以自行课下探讨。(2)对于已经学过的内容不再详细讲解,而是侧重介绍它们在数据挖掘中的功能及综合应用。在新知识的讲解过程中,注意和已学过知识的融汇贯穿,既复习巩固了原来学过的知识,同时也无形中降低了新知识的难度。比如,在数据挖掘模型评估中,把混淆矩阵、ROC 曲线、误差平方和等知识点...