南开大学2021年9月《大数据开发技术》作业考核试题及答案参考1
可视化工具包括()
ExcelB
GoogleChartC
GephiD
ppt参考答案:ABC2
MspReduce中的Map和Reduce函数使用()进行输入输出
key/value对B
其他计算结果参考答案:A3
键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD
错误参考答案:A4
关系数据库的关键特性包括完善的事务机制和高效的查询机制
错误参考答案:A5
Pentaho是最流行的开源商业智能软件之一
错参考答案:A6
感知式系统的广泛使用人类社会数据量第三次大的飞跃最终导致了大数据的产生
错误参考答案:A7
Spark中DataFrame的()方法是进行分组查询A
orderbyB
groupbyC
selectbyD
sortby参考答案:B8
GoogleChartAPI是哪种可视化工具()A
时间线工具D
分析工具参考答案:A9
数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段
运营式系统阶段B
用户原创内容阶段C
感知式系统阶段参考答案:A10
Spark创建DataFrame对象方式有()A
结构化数据文件B
外部数据库C
Hive中的表参考答案:ABCD11
HDFS的命名空间包含()A
块参考答案:BCD12
Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A
printB
saveAsTextFilesC
saveAsObjectFilesD
saveAsHadoopFiles参考答案:D13
Mllib中metrics
recallByThreshold表