《大数据导论》课程期末复习资料 《大数据导论》课程讲稿章节目录: 第 1 章 大数据概述 (1)大数据的概念 (2)大数据的特征 (3)大数据的数据类型 (4)大数据的技术 (5)大数据的应用 第 2 章 大数据采集与预处理 (1)大数据采集 (2)大数据预处理概述 (3)数据清洗 (4)数据集成 (5)数据变换 (6)数据规约 第 3 章 大数据存储 (1)大数据存储概述 (2)数据存储介质 (3)存储系统结构 (4)云存储概述 (5)云存储技术 (6)新型数据存储系统 (7)数据仓库 第 4 章 大数据计算平台 (1)云计算概述 (2)云计算平台 (3)MapRedu ce 平台 (4)Hadoop 平台 (5)Spark 平台 第 5 章 大数据分析与挖掘 (1)大数据分析概述 (2)大数据分析的类型及架构 (3)大数据挖掘 (4)大数据关联分析 (5)大数据分类 (6)大数据聚类 (7)大数据分析工具 第 6 章 大数据可视化 (1)大数据可视化概述 (2)大数据可视化方法 (3)大数据可视化工具 第 7 章 社交大数据 (1)社交大数据 (2)国内社交网络大数据的应用 (3)国外社交网络大数据的应用 第8 章 交通大数据 (1)交通大数据概述 (2)交通监测应用 (3)预测人类移动行为应用 第9 章 医疗大数据 (1)医疗大数据简介 (2)临床决策分析应用 (3)医疗数据系统分析 第10 章 大数据的挑战与发展趋势 (1)大数据发展面临的挑战 (2)大数据的发展趋势 一、客观部分:(单项选择、多项选择) (一)、单项选择 1.以下不是 NoSQL 数据库的是() A.MongoDB B.HBase C.Cassandra D.DB2 ★考核知识点:NoSQL 与NewSQL 主流系统 参考讲稿章节:3.7 附 1.1.1(考核知识点解释): 目前市场上主要的NoSQL 数据存储工具有:BigTable、Dynamo 、Hbase、MongoDB、CouchDB、Hypertable 还存在一些其他的开源的NoSQL 数据库,Neo4j、Oracle Berkeley DB、Apache Cassandra 等 另外,NewSQL 数据库。例如:GoogleSpanner、VoltDB、RethinkDB、Clustrix、TokuDB 和 MemSQL 等。 2 以下不是目前主流开源分布式计算系统的是() A.Azure B.Hadoop C.Spark D.Storm ★考核知识点:主流开源分布式计算系统 参见讲稿章节:4.2 附1.1.2:(考核知识点解释) 由于Google 没有开源Google 分布式计算模型的技术实现,所以其他互联网公司只能根据Google 三篇技术论文...