南开大学20秋学期《大数据开发技术(二)》在线作业(参考答案) VIP免费

下载本文档

阅读 145
下载 26
格式 pdf
大小 577.37 KB
约23页
2024-11-11 发布于山东
收藏
评论
点赞(0)
海报
举报

1/23页

2/23页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/23

文本预览下载提示常见问题

1.()是AMPLab发布的一个R开发包，使得R摆脱单机运行的命运，可以作为Spark的Job运行在集群上。A.SparkRB.BlinkDBC.GraphXD.Mllib答案：A2.图的结构通常表示为：G(V，E)，其中，V是图G中()。A.顶点B.顶点的集合C.边D.边的集合答案：B3.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles答案：D4.()是Spark的核心，提供底层框架及核心支持。A.SparkCoreB.SparkSQLC.SparkStreamingD.Mllib答案：A5.Spark中的每个RDD一般情况下是由()个分区组成的。A.0B.1C.多D.无数答案：C6.RDD的()操作通常用来划分单词。A.filterB.unionC.flatmapD.mapPartitions答案：C7.图结构中如果任意两个顶点之间都存在边，那么称之为()。A.完全图B.有向完全图C.无向图D.简单图答案：A8.SparkGraphX中类Graph的aggregateMessages方法可以()。A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中答案：C9.Spark中DataFrame的()方法是进行连接查询。A.whereB.joinC.limitD.apply答案：B10.以下哪个不是Scala的数据类型?()A.AnyRefB.AnythingC.NULLD.Nothing答案：B11.GraphX中()方法可以释放边缓存。A.cacheB.presistC.unpersistVerticesD.edges.unpersist答案：D12.()是Spark的数据挖掘算法库。A.SparkCoreB.BlinkDBC.GraphXD.Mllib答案：D13.在图结构中，每个元素都可以有()后继。A.至少一个B.零个或多个C.一个D.零个答案：B14.以下哪个方法可以从外部存储中创建RDD?()A.parallelizeB.makeRDDC.textFileD.loadFile答案：C15.Graph类中如果要根据分开存放的顶点数据和边数据创建图，应该用()方法。A.Graph(vertices，edges，defaultVertexAttr)B.Graph.fromEdges(RDD[Edge[ED]]，defaultValue)C.Graph.fromEdgeTuples(rawEdges:RDD[(VertexId，VertexId)]，defaultValue)D.GraphLoader.edgeListFile(sc，filename)答案：A16.SparkGraphX中类Graph的joinVertices方法可以()。A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中答案：D17.Scala列表方法中返回所有元素，除了最后一个的方法是()。A.dropB.headC.filterD.init答案：D18.以下哪个函数可以对RDD进行排序?()A.sortByB.filterC.distinctD.intersection答案：A19.递归函数意味着函数可以调用它()。A.其他函数B.主函数C.子函数D.自身答案：D20.SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream，这可以用来在DStream做任意RDD操作。A.transB.reduceC.joinD.cogroup答案：A21.如果numPartitions是分区个数，那么Spark每个RDD的分区ID范围是()。A.[0，numPartitions]B.[0，numPartitions-1]C.[1，numPartitions-1]D.[1，numPartitions]答案：B22.图结构中如果任意两个顶点之间都存在有向边，那么称之为()。A.完全图B.有向完全图C.无向图D.简单图答案：B23.GraphX中VertexRDD[VD]继承自()。A.EdgeRDDB.RDD[Edge]C.VertexRDD[VD]D.RDD[(VertexId，VD)]答案：D24.Scala列表方法中通过给定的方法将所有元素重新计算的方法是()。A.filterB.foreachC.mapD.mkString答案：C25.图结构中如果无重复的边或者顶点到自身的边，那么称之为()。A.完全图B.有向完全图C.无向图D.简单图答案：D26.以下哪个方法可以从集合中创建RDD?()A.parallelizeB.makeRDDC.textFileD.loadFile答案：AB27.Scala支持()。A.匿名函数B.高阶函数C.函数嵌套D.柯里化答案：ABCD28.MapReudce不适合()任务。A.大数据计算B.迭代C.交互式D.离线分析答案：BC29.SparkDataFrame中()方法可以获取若干行数据。A.firstB.headC.takeD.collect答案：ABCD 30.MLBase包括()A.MllibB.MLIC.SparkRD.GraphX答案：AB31.Spark中的RDD的说法正确的是()。A.弹性分布式数据集B.是Spark中最基本的数据抽象C.代表一个可变的集合D.代表的集合里面的元素可并行计算答案：ABD32.SparkStreaming能够处理来自()的数据。A.KafkaB.FlumeC.TwitterD.ZeroMQ答...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

南开大学20秋学期《大数据开发技术(二)》在线作业(参考答案)

()是AMPLab发布的一个R开发包，使得R摆脱单机运行的命运，可以作为Spark的Job运行在集群上

SparkRB

BlinkDBC

GraphXD

Mllib答案：A2

图的结构通常表示为：G(V，E)，其中，V是图G中()

顶点的集合C

边的集合答案：B3

Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存

printB

saveAsTextFilesC

saveAsObjectFilesD

saveAsHadoopFiles答案：D4

()是Spark的核心，提供底层框架及核心支持

SparkCoreB

SparkSQLC

SparkStreamingD

Mllib答案：A5

Spark中的每个RDD一般情况下是由()个分区组成的

无数答案：C6

RDD的()操作通常用来划分单词

filterB

unionC

flatmapD

mapPartitions答案：C7

图结构中如果任意两个顶点之间都存在边，那么称之为()

有向完全图C

简单图答案：A8

SparkGraphX中类Graph的aggregateMessages方法可以()

收集邻居顶点的顶点Id和顶点属性B

收集邻居顶点的顶点IdC

向指定顶点发送信息并聚合信息D

将顶点信息更新到图中答案：C9

Spark中DataFrame的()方法是进行连接查询

whereB

limitD

apply答案：B10

以下哪个不是Scala的数据类型

AnyRefB

AnythingC

Nothing答案：B11

GraphX中()方法可以释放边缓存

cacheB

presistC

unpersistVerticesD

您可能关注的文档

雪雪文库 + 关注: 实名认证
内容提供者

各类文档，专业文档

收藏店铺进入空间

南开大学20秋学期《大数据开发技术(二)》在线作业(参考答案) VIP免费

南开大学20秋学期《大数据开发技术(二)》在线作业(参考答案)

您可能关注的文档

相关文档

热门下载

相关标签