电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

本科课程教学大纲《数据科学导论》VIP免费

本科课程教学大纲《数据科学导论》_第1页
1/9
本科课程教学大纲《数据科学导论》_第2页
2/9
本科课程教学大纲《数据科学导论》_第3页
3/9
数据科学导论》教学大纲、课程及教师基本信息课程名称(中/英文)数据科学导论introductiontodatascience学分4+2总学时17X4=68是/否含实验(实践)教学环节是实验(实践)教学环节学时4(折算2学分)课程编号21020066周学时4课程性质学科基础授课对象理科实验班授课教室/授课时间星期二(1-2)星期五(7-8)先修课程要求高等数学、高等代数、概论论与数理统计任课教师信息姓名覃雄派职称讲师办公时间及地点:星期一至星期五,9:00am-5:00pm办公电话:邮箱地址:助教信息姓名:/助教办公(答疑或辅导)时间:习题课地点、时间:星期五(11-14)助教联系电话、邮箱地址:/考核方式平时考核占总考核比例(60%)考核类型课程作业研讨交流期中考试占总考核比例///期末考核占总考核比例(40%)请写明具体的考核形式,如开卷考试、闭卷考试、论文写作等。强调诚信考试。见如下说明。注1:平时考核(100%)=15%平时作业+15%projectl流数据处理/结构化数据分析+15%project2文本分析+15%project3图数据分析;2:平时考核应占总成绩的40-70%。考核办法说明:本课程的考核分为三个方面,包括平时上机实践、3个大作业(即流数据处理/结构化数据分析、文本分析、图数据分析)和期末闭卷考试。平时上机实践,学生必须完成上机练习题目,并提交上机实验报告;大作业锻炼学生综合运用所学知识、解决复杂问题的能力;期末考试考查学生对知识点的掌握和灵活运用能力。最终成绩的计算按照平时成绩:大作业1:大作业2:大作业3:期末成绩=15:15:15:15:4的0比例产生。二、任课教师简介三、课程简介课程简介“数据科学导论”是一门入门课程,同时也是“数据科学”课程群统领式的课程,把学生引进数据科学的大门。它的目标有两个:一个是扩展学生在数据科学方面的视野培养兴趣,另一个是为学习后续课程打下坚实的基础,培养数据科学家。教学内容分为四大模块,分别是基础(base)模块、关系数据/流数据处理(relational&stream)模块、文本数据处理和分析(text)模块、图数据处理和分析(graph)模块。基础模块为后续的3个实践模块的基础,内容包括:•概念:数据科学概论,主要介绍数据科学的基本概念、大数据及其价值、数据处理的全生命周期,包括数据的采集和获取、数据预处理/清洗和集成、数据管理、数据分析、可视化和解释等;•方法:包括各种数据模型、数据处理的不同模式(批处理和流式处理)、通用的数据分析方法、数据可视化等;•平台和工具:包括分布式计算与大数据平台(Hadoop&Spark)以及Python语言。其中Python语言部分,包括对Python语言基础以及Python的几个重要的库(数据预处理库pandas、机器学习库Scikit-Leam、可视化库Matplotlib)的介绍。基础模块的内容划分如表1所示。•表1数据科学导论课程内容的基础模块构成子模块内容basel数据科学概论、数据处理的全生命周期(从数据到大数据,再到大数据应用)base2数据科学语言Python与数据可视化入门base3分布式计算与大数据平台Hadoop/Spark解决大数据的规模(volume)问题base4各种数据模型、通用的数据分析方法入门,解决大数据类型多样(variety)的问题base5数据处理的不冋模式(批处理和流式处理),数据清洗和数据质量保证、数据集成,解决大数据速度快(velocity)和类型多样(veracity)的问题关系数据/流数据处理模块提供两个选项,可以根据需要进行选择。第一个选项侧重于介绍大数据的实时流式处理,内容包括流式处理基础、流式处理工具和流式处理应用,可以选择Storm作为典型流式数据处理系统加以介绍,大作业(project)部分可以针对传感器数据,实现实时汇总和可视化。第二个选项侧重于介绍关系模型、SQL语言以及分布式大数据多维分析(OLAP),工具部分可以选择MySQL以及SQLonHadoop系统加以介绍,会用即可,大作业部分可以针对销售数据进行多维分析以及可视化。文本数据处理和分析模块介绍相关的处理平台和分析工具,引导学生使用相关的工具实现文本的获取、处理、分词、索引与检索、分类、可视化等关键任务。大作业部分基于短文本数据实现垃圾信息的自动过滤。图数据处理和分析模块依赖于GraphXonSpark平台(工具)或者Neo4J数据库,对图数据进...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

本科课程教学大纲《数据科学导论》

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部