电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版精品VIP免费

南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版精品_第1页
1/12
南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版精品_第2页
2/12
书山有路勤为径,学海无涯苦作舟!住在富人区的她南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版(带答案)一.综合考核(共50题)1.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D2.GraphX中Edge边对象存有()字段A.srcIdB.dstIdC.attrD.val参考答案:ABC3.如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()。A.[0,numPartitions]B.[0,numPartitions-1]C.[1,numPartitions-1]D.[1,numPartitions]参考答案:B4.MLlib中进行数据标准化的方式有()A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD书山有路勤为径,学海无涯苦作舟!住在富人区的她5.SparkGraphX中类Graph的joinVertices方法可以()A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中参考答案:D6.Scala列表方法中返回所有元素,除了最后一个的方法是()。A.dropB.headC.filterD.init参考答案:D7.Mllib中线性会馆算法中的参数reParam表示()A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D8.以下哪个方法可以创建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:ABC书山有路勤为径,学海无涯苦作舟!住在富人区的她9.PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。()A.正确B.错误参考答案:A10.SparkStreaming支持实时流式数据,包括()。A.Web服务器日志文件B.社交网络数据C.实时交易数据D.类似Kafka的信息数据参考答案:ABCD11.以下哪个函数可以对RDD进行去重()A.sortByB.filterC.distinctD.intersection参考答案:C12.SparkDataFrame中()方法可以返回一个ListA.collectB.takeC.takeAsListD.collectAsList参考答案:CD13.Spark创建DataFrame对象方式有()A.结构化数据文件B.外部数据库C.RDD书山有路勤为径,学海无涯苦作舟!住在富人区的她D.Hive中的表参考答案:ABCD14.RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。()A.正确B.错误参考答案:B15.Mllib中线性会馆算法中的参数reParam默认值是()参考答案:116.SparkSQL可以通过()方法加载json文件为DataFrameA.formatB.jsonC.getD.read参考答案:AB17.图的结构通常表示为:G(V,E),其中,E是图G中()A.顶点B.顶点的集合C.边D.边的集合参考答案:D18.图的结构通常表示为:G(V,E),其中,G表示()书山有路勤为径,学海无涯苦作舟!住在富人区的她A.图B.子图C.顶点D.边参考答案:A19.Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是()A.filterB.flattenC.groubyD.flatmap参考答案:A20.()是Spark的数据挖掘算法库A.SparkCoreB.BlinkDBC.GraphXD.Mllib参考答案:D21.Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。()A.正确B.错误参考答案:B22.GraphX中()方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges书山有路勤为径,学海无涯苦作舟!住在富人区的她参考答案:A23.以下算法中属于分类算法的是()A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC24.图结构中如果无重复的边或者顶点到自身的边,那么称之为()A.完全图B.有向完全图C.无向图D.简单图参考答案:D25.以下哪个函数可以对RDD进行排序()A.sortByB.filterC.distinctD.intersection参考答案:A26.Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C书山有路勤为径,学海无涯苦作舟!住在富人区的她27.Graph类中如果要根据分开存放的顶点数据和边数据创建图,应该用()方法。A.Graph(vertices,edges,defaultVertexAttr)B.Graph.fromEdges(RDD[Edge[ED]],defaultValue)C.Graph.fromEdgeTuples(rawEdges:RDD[(VertexId,VertexId)],defaultValue)D.GraphLoader.edgeListFile(sc,...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版精品

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部