大数据导论期末考试试卷题量:27 满分:100.0 截止日期:2020-06-2516:00一、单选题1.分布式系统比较常见的数据分布方式有(A、哈希方式B、按数据范围分布C、按数据量分布D、一致性哈希E、以上都是我的答案:E2.以下选项不属于可视化基本特征的是(A、易懂性B、全面性C、必然性D、专业性我的答案:B3.数据清洗的方法有(A、填充缺失值B、修改错误值C、消除重复记录D、以上都是我的答案:D4.以下不属于云计算的服务模式的选项是(A、IaaSB、PaaSC、SaaPD、SaaS我的答案:C5.哪一年是中国的微博元年?A、2008B、2009C、2010D、2011我的答案:C6._是大数据的前沿技术A、数据处理B、数据分析C、数据定义D、数据结构我的答案:B7.大数据赖以生存的土壤是_A、互联网B、物联网C、网络信息D、前沿技术我的答案:A二、多选题1.以下是大数据存储面临的挑战的选项是(A、系统问题B、数据问题C、应用问题D、管理问题我的答案:ACD2.目前来说,以下选项是解决数据集成的主要难题的是A、异构性B、分布性C、自治性D、同构性我的答案:AB3.数据挖掘常用算法有(A、分类B、聚类C、特征分析D、决策树归纳法我的答案:ABCD4.大数据的采集方法有(A、系统日志采集方法B、网络数据采集方法C、数据库采集D、以上都不正确我的答案:AB5.以下属于云计算的特点的是(A、资源池弹性可扩张B、虚拟化C、以人为中心D、高可靠和安全性我的答案:ABD三、判断题1.大数据分析是大公司或是科技大厂的专利我的答案:x2.数据预处理是指在主要的处理后对数据进行的一些处理我的答案:x3.只要有数据,就必然存在安全与隐私的问题我的答案:p4.在数据处理方面,有一个著名的“一秒定律”,即要在秒级时间范围内给出分析结果,超出这个时间,数据就失去价值。我的答案:p5•与 Oracle 性能关系最大的是 SGA。我的答案:p四、填空题1•存储系统的类别有()、()、()我的答案:第一空:块存储第二空:文件存储第三空:对象存储2.NoSQL 数据库是()的缩写我的答案:第一空:NotOnlySQL3•()是大数据分析和应用的基础,()和()是数据分析的第一步我的答案:第一空:数据第二空:数据采集第三空:预处理4•大数据的 4V 特征分别是(),(),(),()我的答案:第一空:第二空第三空容量大(Volume)多样性(Variety)价值咼(Value)速度快(Velocity)5.Hadoop 核心模块包括()和()我的答案:第一空:HDFS第二空:MapReduce五、简答题1.列举常用的大数据可...