书山有路勤为径,学海无涯苦作舟
住在富人区的她南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版(带答案)一
综合考核(共50题)1
Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存
printB
saveAsTextFilesC
saveAsObjectFilesD
saveAsHadoopFiles参考答案:D2
GraphX中Edge边对象存有()字段A
srcIdB
dstIdC
val参考答案:ABC3
如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()
[0,numPartitions]B
[0,numPartitions-1]C
[1,numPartitions-1]D
[1,numPartitions]参考答案:B4
MLlib中进行数据标准化的方式有()A
NormalizerB
StandardC
StandardScaleerD
MinMaxScaler参考答案:ACD书山有路勤为径,学海无涯苦作舟
住在富人区的她5
SparkGraphX中类Graph的joinVertices方法可以()A
收集邻居顶点的顶点Id和顶点属性B
收集邻居顶点的顶点IdC
向指定顶点发送信息并聚合信息D
将顶点信息更新到图中参考答案:D6
Scala列表方法中返回所有元素,除了最后一个的方法是()
filterD
init参考答案:D7
Mllib中线性会馆算法中的参数reParam表示()A
要运行的迭代次数B
梯度下降的步长C
是否给数据加干扰特征或者偏差特征D
Lasso和ridge的正规化参数参考答案:D8
以下哪个方法可以创建RDD()A
parallelizeB
makeRDDC
textFile