南开大学2020春《大数据导论》期末考核答卷附标准答案南开大学20春《大数据导论》期末考核附标准答案试卷总分:100得分:70一、单选题(共10道试题,共20分)1.大数据的特点不包含A.数据体量大B.价值密度高C.处理速度快D.数据不统一答案:D2.PaaS是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务答案:B3.IaaS是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务答案:C更多加微boge306194.购物篮问题是的典型案例A.数据变换B.关联规则挖掘C.数据分类答案:B5.基础设施即服务的英文简称是A.IaaSB.PaaSC.SaaS答案:A6.数据清洗的方法不包括A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理答案:D7.以下哪项不是数据可视化工具的特性()A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可答案:D8.下列哪个工具常用来开发移动友好地交互地图()A.LeafletB.Visual.lyC.BPizzaPieChartsD.Gephi答案:A9.SAN是一种()A.存储设备B.专为数据存储而设计构建的网络C.光纤交换机D.HBA答案:B10.GFS中的文件切分成()的块进行存储A.32MBB.64MBC.128MBD.1G答案:B二、多选题(共10道试题,共20分)11.数据预处理的过程主要是A.数据清洗B.数据集成C.数据变换D.数据规约答案:ABCD12.大数据时代预测人类移动行为的数据特点是A.多样化B.数据量大C.维数高D.变化快答案:BCD13.下列属于传统统计学展示方法的是()A.柱状图B.饼状图C.曲线图D.网络图答案:ABC14.百度大数据引擎主要包含三大组件()A.开放云B.数据工厂C.百度大脑。答案:ABC15.去除噪声使得数据光滑的技术主要有:A.分箱B.回归C.离群点分析答案:ABC16.大数据存储的特点与挑战有()A.容量问题B.延迟问题C.安全问题D.成本问题答案:ABCD17.大数据在医疗中的应用有()A.流行性疾病预防B.慢性病健康管理C.临床决策支持D.医疗器械研发答案:ABCD18.医疗大数据的来源主要包括()A.制药企业/生命科学B.临床医疗/实验室数据C.费用报销/利用率D.健康管理/社交网络答案:ABCD19.数据分析的类型根据数据分析深度可以分为()A.描述性分析B.预测性分析sC.规则性分析答案:ABC20.数据处理的两种方法是##,##A.批处理B.流处理C.单个处理D.交叉处理答案:AB三、判断题(共15道试题,共30分)21.所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。答案:正确22.关联分析是从有噪声的、模糊的、随机的海量数据中,挖掘出隐藏的、事先不知道、