南开大学2021年9月《大数据开发技术》作业考核试题及答案参考1
大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等
错参考答案:A2
PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作
错误参考答案:B3
RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD
错误参考答案:A4
关于Strom中Bolt说法错误的是()
Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作B
Bolt是一个被动的角色,Spout是一个主动的角色C
Bolt不仅可以处理Tuple还可以创建新的TupleD
Bolt是Streams的状态转换过程的抽象含义参考答案:C5
Scala列表方法中将函数应用到列表的所有元素的方法是()A
filterB
foreachC
mkString参考答案:B6
spark-submit配置项中()表示启动的executor数量A
--num-executorsNUMB
--executor-memoryMEMC
--total-executor-coresNUMD
--executor-couresNUM参考答案:A7
Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素
错参考答案:F8
计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步
正确参考答案:B9
HDFS中SecondaryNameNode可减少()重启的时间A
NameNodeB
SecondaryNameNodeC
DataNodeD
Block参考答案:A10
SparkG