电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

南开大学2024年9月《大数据开发技术》作业考核试题及答案参考1 VIP免费

南开大学2024年9月《大数据开发技术》作业考核试题及答案参考1 _第1页
1/7
南开大学2024年9月《大数据开发技术》作业考核试题及答案参考1 _第2页
2/7
南开大学2021年9月《大数据开发技术》作业考核试题及答案参考1.可视化工具包括()。A.ExcelB.GoogleChartC.GephiD.ppt参考答案:ABC2.MspReduce中的Map和Reduce函数使用()进行输入输出。A.key/value对B.随机数值C.其他计算结果参考答案:A3.键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。()A.正确B.错误参考答案:A4.关系数据库的关键特性包括完善的事务机制和高效的查询机制。()A.正确B.错误参考答案:A5.Pentaho是最流行的开源商业智能软件之一。()A.对B.错参考答案:A6.感知式系统的广泛使用人类社会数据量第三次大的飞跃最终导致了大数据的产生。()A.正确B.错误参考答案:A7.Spark中DataFrame的()方法是进行分组查询A.orderbyB.groupbyC.selectbyD.sortby参考答案:B8.GoogleChartAPI是哪种可视化工具()A.信息图表B.地图工具C.时间线工具D.分析工具参考答案:A9.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?()A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A10.Spark创建DataFrame对象方式有()A.结构化数据文件B.外部数据库C.RDDD.Hive中的表参考答案:ABCD11.HDFS的命名空间包含()A.节点B.目录C.文件D.块参考答案:BCD12.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D13.Mllib中metrics.recallByThreshold表示()指标A.准确度B.召回率C.F值D.ROC曲线参考答案:B14.最大效益优先是下列哪项的一种搜索方式?()A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A15.Scala中合并两个数组的方法是()A.lineB.addC.appendD.concat参考答案:D16.很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态参考答案:D17.以下哪些是数据可视化时间线工具()A.EchartsB.TimetoastC.XtimelineD.R参考答案:BC18.Spark对只有未曾设置存储级别的RDD才能设置存储级别,设置了存储级别的RDD不能修改其存储级别。()A.正确B.错误参考答案:A19.RDD是一个可读写的数据结构。()T.对F.错参考答案:F20.已得到广泛应用的分布式文件系统主要包括()。A.GFSB.MapReduceC.HbaseD.HDFS参考答案:AD21.Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素。()A.正确B.错误参考答案:B22.Scala中元组是是一种可迭代的键值对(key/value)结构。()A.正确B.错误参考答案:B23.用分支限界法设计算法的第二步是()。A.针对所给问题,定义问题的解空间(对解进行编码)B.确定易于搜索的解空间结构(按树或图组织解)C.以广度优先或以最小耗费(最大收益)优先的方式搜索解空间D.在搜索过程中用剪枝函数避免无效搜索参考答案:B24.SQLAzure体系结构层中哪层是硬件和操作系统()A.ClientLayerB.ServicesLayerC.Platform.LayerD.InfrastructureLayer参考答案:D25.对于不同顶点之间的信息交换,Pregel采用了()A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案:C26.MapReduce的main函数中设置输出类型的方法有()。A.setOutputKeyClassB.setOutputClassC.setOutputValueClassD.setKeyValueClass参考答案:AC27.以下哪个不是Scala的数据类型()A.IntB.ShortIntC.LongD.Any参考答案:B28.以下哪个函数可以对RDD进行去重()A.sortByB.filterC.distinctD.intersection参考答案:C29.利用概率的性质计算近似值的随机算法是数值概率算法,运行时以一定的概率得到正确解的随机算法是蒙特卡罗算法。()A.错误B.正确参考答案:B30.Mllib实现了一些常见的机器学习算法和应用程序,包括()A.分类B.聚类C.降维D.回归参考答案:ABCD

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

南开大学2024年9月《大数据开发技术》作业考核试题及答案参考1

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部