()是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为Spark的Job运行在集群上
SparkRB
BlinkDBC
GraphXD
Mllib答案:A2
图的结构通常表示为:G(V,E),其中,V是图G中()
顶点的集合C
边的集合答案:B3
Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存
printB
saveAsTextFilesC
saveAsObjectFilesD
saveAsHadoopFiles答案:D4
()是Spark的核心,提供底层框架及核心支持
SparkCoreB
SparkSQLC
SparkStreamingD
Mllib答案:A5
Spark中的每个RDD一般情况下是由()个分区组成的
无数答案:C6
RDD的()操作通常用来划分单词
filterB
unionC
flatmapD
mapPartitions答案:C7
图结构中如果任意两个顶点之间都存在边,那么称之为()
有向完全图C
简单图答案:A8
SparkGraphX中类Graph的aggregateMessages方法可以()
收集邻居顶点的顶点Id和顶点属性B
收集邻居顶点的顶点IdC
向指定顶点发送信息并聚合信息D
将顶点信息更新到图中答案:C9
Spark中DataFrame的()方法是进行连接查询
whereB
limitD
apply答案:B10
以下哪个不是Scala的数据类型
AnyRefB
AnythingC
Nothing答案:B11
GraphX中()方法可以释放边缓存
cacheB
presistC
unpersistVerticesD