XXXX大学大学生创新训练计划项目申报书项目名称I基于xxxxxxx的研究与实现―、项目研究的目的和主要研究内容研究目的:随着大数据时代的到来,教育数据正如漂浮在海岸的冰,第一眼只能看到冰山一角,绝大部分都隐藏在表面之下。而发掘教育数据价值以及政府教育数据海洋的“动力”就是教育数据挖掘。但是随着教育数据挖掘技术的不断深入,教育数据的多元化、不确定性、非关系性和网络化使得传统数据库软件工具的捕捉、储存、管理和分析成为了教育数据挖掘的一大难题。针对高校教育中存在的学生质量参差不齐、专业课程存在差异、学生学习行为复杂且不统一以及高校教学数据库中的累计的数据巨大而教育从业者能获得的即时信息极少的现状,项目组通过运用教育数据挖掘的知识的学习和研究,通过对学生成绩、课程安排、在线学习时段以及时长等学生行为进行分析处理,挖掘出数据中隐藏信息,用于对学生个体以及整体的预测和聚类,对学生的潜在学习方向和能力定位,提高学生的学习效率和明确学生的学习方向,为教育者更好地进行个性化教学提供帮助。主要研究内容:1、教育数据挖掘的实际应用研究。针对高校的教育数据分析的现状,研究讨论开发平台的需求和设计方案。2、数据获取。通过网络爬虫的方式采集数据,并保存到服务器,服务器对数据进行初步处理、保存数据。3、数据筛选。为了获得针对性的训练集数据,需要从爬取的众多数据中寻找出需要的数据。4、数据预处理。筛选后的数据进行预处理操作,删除明显错误、补全数据等保证数据的完整性,方便后续模型功能的实现。5、高校学生学习行为分类模型的建立。朴素贝叶斯模型具有良好的分类正确率和效率,使其在诸多领域中表现出良好的性能,尤其在数据挖掘和人工智能方面有着广泛的应用,但是由于传统朴素贝叶斯分类模型忽略了属性间依赖关系造成了分类准确性降低。为此建立了基于属性加权的改进模型。6、基于贝叶斯神经网络的预测模型的建立。通过对朴素贝叶斯的优化,采用贝叶斯神经网络可以实现预测和分类,通过贝叶斯神经网络的模型构建实现对于教育数据的预测,使得分类和预测相结合,挖掘出更多对于教育者和学生可用的信息。7、高校学生学习行为分析模型建立。通过分类和预测的相互结合,通过预处理后的数据进行分析处理,输出需要的训练结果,完成高校学生分析平台模型的建立。8、软件开发。开发包括数据输入、数据分析和结果呈现为一体的软件平台,设计前台、后台及数据库,实现数据录入、数据分析,并将数据进行汇总,采用图、表等直观形式呈现统计预测结果。二、国、内外研究现状和发展动态1、国内外研究现状大数据是近年来快速发展的技术领域。关于大数据的研究与应用与日俱增,并不断深入影响社会生活。2016年3月,AlphaGo与李世石的人机大战,让人们从更深层次上认识了大数据驱动下的人工智能对人类社会的深层影响,根据大数据版图3.0版本的描绘,大数据相关基础设施、分析工具和应用系统都在快速发展中。在教育领域,大数据已经在多方面引起了研究者和实践者的关注,教育大数据正在成为教育领域不可忽视的新型驱动力,在教育教学研究与实践中发挥着越来越重要的作用。目前,国外教育数据挖掘研究主要涉及到理论探索和方法介绍的描述性研究、可行性分析论证研究、教育数据挖掘方法的具体应用等方面,如美国将教育数据应用到医疗、保险、户籍等多个方面,通过数据的关联分析与挖掘为用户提供精准服务。国外对新兴技术与新媒体应用于教学的研究呈多元化趋势,而这些研究也推动了一系列教育应用的发展,国外对于教育数据开放的研究相对成熟,从法律到基础设施都相对完善。相对国外而言,国内对大数据的研究处于起步阶段,国内教育大数据研究主要集中在教育教学改革、教学模式及应用、教育数据分析和个性化学习研究、人才培养、教师专业发展等方面,主要侧重于理论层面的探索以及对国外案例介绍。基于数据挖掘技术在成绩预测上的运用在国内仍不是特别成熟,相应的软件平台更是少之又少。2、发展动态在教育大数据日趋瞩目的今天,分析教育大数据的定义内涵、实践范例、发展趋势与面临挑战,有助于我们把握教育大数据的整体图景,顺应技...