2020 年大数据及其应用试题及答案 练习一:大数据方法与工具 1、(单选,10 分) 不属于 Hadoop 生态系统的是( ) A、HDFS B、GFS C、HBase D、Hive 答案:B 2、(单选,10 分) MapReduce 计算模型的描述,错误的是( ) A、MapReduce 采用的是一种分而治之的思想 B、MapReduceMapReduce要求待处理数据集可以分解为能并行处理的小数据集 C、MapReduce 适合于实时在线任务的应用场景 D、MapReduce 可以处理离线任务 答案:C 3、(单选,10 分) Spark 描述正确的是( ) A、Spark Streaming是将 Stream 数据分成小的时间片段(几秒) B、Spark 是专为大规模数据处理而设计的快速通用的计算引擎 C、内存计算下 Spark 比 Hadoop 快 100 倍 D、Spark 不适合处理离线数据。 答案:D 4、(单选,10 分) 下列关于人工智能技术描述错误的是( ) A、人工智能技术是大数据分析的重要方法 B、计算智能属于人工智能技术 C、深度学习通常需要昂贵的GPU 设备,不太适合于大数据分析 D、传统的机器学习对硬件环境要求不高,适合大数据分析。 答案:C 5、(单选,10 分) 聚类分析的描述错误的是( ) A、基于“物以类聚,人以群分”思想 B、采用样本间距离度量相似性,将数据分类划分到已有类别 C、k-means 算法适合于非此即彼的聚类分析方法 D、对于有层级关系的样本,可以采用自底向上的凝聚式层次聚类分析方法 答案:B 6、(单选,10 分) 关于深度学习算法的描述,错误的是( ) A、深度学习通过组合低层特征形成更加抽象的高层特征或类别。 B、深度学习算法适合于语音识别、文字识别、智能客服等应用场景 C、深度学习应用于人脸识别时,首先根据每个像素的亮度来识别边缘,然后根据边缘再识别出轮廓,最后根据轮廓识别出特定图像。 D、KNN、SVM 等算法属于深度学习算法。 答案:D 7、(单选,10 分) 计算智能描述错误的是( ) A、计算智能是在生物遗传、变异、生长以及外部环境的自然选择 中 产 生的 B、计算智能包括遗传算法、粒子群算法、蚁群算法等 C、粒子群算法是模拟鸟随机搜索食物的算法 D、计算智能是局部最优算法 答案:D 8、(单选,10 分) 深度学习开源软件框架描述,错误的是( ) A、TensorFlow 支持多种操作系统和终端设备 B、Caffe 支持命令行、 Python 和 MATLAB 接口 C、PyTorch 内嵌自动求导系统,使其成为最流行的动态图像处理框架 D、2...