电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

南开大学2024年8月《大数据开发技术》作业考核试题及答案参考1 VIP免费

南开大学2024年8月《大数据开发技术》作业考核试题及答案参考1 _第1页
1/6
南开大学2024年8月《大数据开发技术》作业考核试题及答案参考1 _第2页
2/6
南开大学2021年8月《大数据开发技术》作业考核试题及答案(参考)1.Spark中DataFrame的()方法是进行条件查询A.whereB.joinC.limitD.apply参考答案:A2.以下哪些是数据可视化时间线工具()A.EchartsB.TimetoastC.XtimelineD.R参考答案:BC3.程序是算法用某种程序设计语言的具体实现。()A.错误B.正确参考答案:B4.GraphX中()方法可以查询度数A.degreesB.degreeC.verticesD.edges参考答案:A5.最大效益优先是下列哪项的一种搜索方式?()A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A6.关系数据库的关键特性包括完善的事务机制和高效的查询机制。()A.正确B.错误参考答案:A7.UMP系通过()来实现实现数据路由的基本功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:B8.MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。A.MB.NC.M-1D.N-1参考答案:A9.备忘录方法是哪种算法的变形?()A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B10.Spark中DataFrame的()方法是进行排序查询A.orderbyB.groupbyC.selectbyD.sortby参考答案:A11.使用回溯法进行状态空间树裁剪分支时一般有两个标准:约束条件和目标函数的界,N皇后问题和0/1背包问题正好是两种不同的类型,其中同时使用约束条件和目标函数的界进行裁剪的是0/1背包问题,只使用约束条件进行裁剪的是N皇后问题。()A.错误B.正确参考答案:B12.Scala中合并两个数组的方法是()A.lineB.addC.appendD.concat参考答案:D13.数据集成(DataIntegration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。()A.对B.错参考答案:A14.Hbase采用()作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A15.spark-submit配置项中()表示启动的executor数量A.--num-executorsNUMB.--executor-memoryMEMC.--total-executor-coresNUMD.--executor-couresNUM参考答案:A16.RDD是一个可读写的数据结构。()T.对F.错参考答案:F17.以下哪个函数可以对RDD进行排序()A.sortByB.filterC.distinctD.intersection参考答案:A18.RDD中join操作最后只返回两个RDD都存在的键的连接结果。()A.正确B.错误参考答案:A19.图结构中如果任意两个顶点之间都存在有向边,那么称之为()A.完全图B.有向完全图C.无向图D.简单图参考答案:B20.可使用(),(),()进行光滑。A.最大值B.箱中位数C.箱边界D.箱均值参考答案:BCD21.MLlib中用于线性回归算法的包主要有()A.LinearRegressionWithSGDB.RidgeRegressionWithSGDC.LassoWithSGDD.LeftRegression参考答案:ABC22.解决0/1背包问题可以使用动态规划、回溯法和分支限界法,其中不需要排序的是动态规划,需要排序的是回溯法,分支限界法。()A.错误B.正确参考答案:B23.关于分布式并行编程,以下说法错误的是()。A.“摩尔定律”,CPU性能大约每隔12个月翻一番B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力D.谷歌公司最先提出了分布式并行编程模型MapReduce参考答案:A24.Hbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件。()A.正确B.错误参考答案:A25.BigTable采用()作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:B26.DataFrame是一个分布式的Row对象的数据集合。()A.正确B.错误参考答案:A27.spark-submit配置项中()表示Driver程序使用的内存大小A.--driver-memoryMEMB.--executor-memoryMEMC.--total-executor-coresNUMD.--executor-couresNUM参考答案:A28.聚类分析(Clusteranalysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)。()A.对B.错参考答案:A29.动态规划算法的基本思想是将待求解问题分解成若干子问题,先求解子问题,然后从这些子问题的解得到原问题的解。()A.错误B.正确参考答案:B30.Scala列表方法中输出符号指定条件的所有元素的方法是()A.dropB.headC.filterD.init参考答案:C

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

南开大学2024年8月《大数据开发技术》作业考核试题及答案参考1

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部