1.()是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为Spark的Job运行在集群上。A.SparkRB.BlinkDBC.GraphXD.Mllib答案:A2.图的结构通常表示为:G(V,E),其中,V是图G中()。A.顶点B.顶点的集合C.边D.边的集合答案:B3.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles答案:D4.()是Spark的核心,提供底层框架及核心支持。A.SparkCoreB.SparkSQLC.SparkStreamingD.Mllib答案:A5.Spark中的每个RDD一般情况下是由()个分区组成的。A.0B.1C.多D.无数答案:C6.RDD的()操作通常用来划分单词。A.filterB.unionC.flatmapD.mapPartitions答案:C7.图结构中如果任意两个顶点之间都存在边,那么称之为()。A.完全图B.有向完全图C.无向图D.简单图答案:A8.SparkGraphX中类Graph的aggregateMessages方法可以()。A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中答案:C9.Spark中DataFrame的()方法是进行连接查询。A.whereB.joinC.limitD.apply答案:B10.以下哪个不是Scala的数据类型?()A.AnyRefB.AnythingC.NULLD.Nothing答案:B11.GraphX中()方法可以释放边缓存。A.cacheB.presistC.unpersistVerticesD.edges.unpersist答案:D12.()是Spark的数据挖掘算法库。A.SparkCoreB.BlinkDBC.GraphXD.Mllib答案:D13.在图结构中,每个元素都可以有()后继。A.至少一个B.零个或多个C.一个D.零个答案:B14.以下哪个方法可以从外部存储中创建RDD?()A.parallelizeB.makeRDDC.textFileD.loadFile答案:C15.Graph类中如果要根据分开存放的顶点数据和边数据创建图,应该用()方法。A.Graph(vertices,edges,defaultVertexAttr)B.Graph.fromEdges(RDD[Edge[ED]],defaultValue)C.Graph.fromEdgeTuples(rawEdges:RDD[(VertexId,VertexId)],defaultValue)D.GraphLoader.edgeListFile(sc,filename)答案:A16.SparkGraphX中类Graph的joinVertices方法可以()。A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中答案:D17.Scala列表方法中返回所有元素,除了最后一个的方法是()。A.dropB.headC.filterD.init答案:D18.以下哪个函数可以对RDD进行排序?()A.sortByB.filterC.distinctD.intersection答案:A19.递归函数意味着函数可以调用它()。A.其他函数B.主函数C.子函数D.自身答案:D20.SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。A.transB.reduceC.joinD.cogroup答案:A21.如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()。A.[0,numPartitions]B.[0,numPartitions-1]C.[1,numPartitions-1]D.[1,numPartitions]答案:B22.图结构中如果任意两个顶点之间都存在有向边,那么称之为()。A.完全图B.有向完全图C.无向图D.简单图答案:B23.GraphX中VertexRDD[VD]继承自()。A.EdgeRDDB.RDD[Edge]C.VertexRDD[VD]D.RDD[(VertexId,VD)]答案:D24.Scala列表方法中通过给定的方法将所有元素重新计算的方法是()。A.filterB.foreachC.mapD.mkString答案:C25.图结构中如果无重复的边或者顶点到自身的边,那么称之为()。A.完全图B.有向完全图C.无向图D.简单图答案:D26.以下哪个方法可以从集合中创建RDD?()A.parallelizeB.makeRDDC.textFileD.loadFile答案:AB27.Scala支持()。A.匿名函数B.高阶函数C.函数嵌套D.柯里化答案:ABCD28.MapReudce不适合()任务。A.大数据计算B.迭代C.交互式D.离线分析答案:BC29.SparkDataFrame中()方法可以获取若干行数据。A.firstB.headC.takeD.collect答案:ABCD 30.MLBase包括()A.MllibB.MLIC.SparkRD.GraphX答案:AB31.Spark中的RDD的说法正确的是()。A.弹性分布式数据集B.是Spark中最基本的数据抽象C.代表一个可变的集合D.代表的集合里面的元素可并行计算答案:ABD32.SparkStreaming能够处理来自()的数据。A.KafkaB.FlumeC.TwitterD.ZeroMQ答...