大数据分布并行处理试题及答案 VIP免费

下载本文档

阅读 133
下载 27
格式 pdf
大小 989.72 KB
约27页
2024-11-08 发布于山东
收藏
评论
点赞(0)
海报
举报

1/27页

2/27页

3/27页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/27

文本预览下载提示常见问题

大数据分布并行处理试题及答案RDD是Spark提供的核心抽象，全称为ResillientDistributedDataset，只能通过文件创建。[判断题]对错(正确答案)spark中的map和flatmap算子的区别是flatmap可以返回多条元素[判断题]对(正确答案)错下面哪个算子容易导致driver端内存溢出？[单选题]mapcountcollect(正确答案)take哪一种持久化策略表示只存储到内存，并且不序列化。[单选题]MEMORY_ONLY(正确答案)cache()MEMORY_AND_DISKMEMORY_ONLY_SERspark中的广播变量可以保证每个Executor内部只保存1份变量数据。[判断题]对错(正确答案)spark中在划分Stage的时候，遇到窄依赖就会划分出前后两个Stage。[判断题]对错(正确答案)spark中的持久化，只是将数据保存在内存中或者本地磁盘文件中，RDD的lineage(血缘关系)是不变的。[判断题]对(正确答案)错HBase属于基于键值对类型的NoSQL数据库。[判断题]对(正确答案)错针对HBase的应用场景的介绍，错误的是：[单选题]适合半结构和非结构数据适合存储记录稀疏的数据适合存储多版本数据适合海量数据分析(正确答案)HBase中不支持数字和字符串数据类型。[判断题]对(正确答案)错HBase中，每一行数据中的Rowkey字段不是必须的，可以为null。[判断题]对错(正确答案)HBase中在建表的时候，列族必须指定，并且后期无法修改。[判断题]对错(正确答案)HBase中，针对具有多个历史版本数据的字段，会按照时间戳正序排序。[判断题]对错(正确答案)HBase中的数据是按照Rowkey正序排序存储的。[判断题]对(正确答案)错向HBase的表t1中添加数据，写法正确的是：[单选题]put't1','rowkey1','info','abc'put't1','rowkey1','info','age:abc'put't1','rowkey1','level:abc','age:xyz'put't1','rowkey1','level:abc','xyz'(正确答案)HBase中，如果一个列族中如果有3列，那么这3列会分到几个文件中存储？[单选题]1(正确答案)234HRegionServer包含了HLog和？[单选题]HRegion(正确答案)HMasterHDFSDataHStore包含两部分：StoreFile和？[单选题]HFileHRegionHMasterMemStore(正确答案)minor合并时会忽略之前标记为删除状态的数据。[判断题]对错(正确答案)HBase中，若MemStore中的数据有丢失，则可以从HLog上恢复。[判断题]对(正确答案)错HBase中一张表中包含以下几个Region：[10,20]，[20,30]，[30,+∞]，那么222将属于Region[30,+∞]。（）[单选题]*A、对B、错(正确答案)下列哪个不是大数据的特征？[单选题]*A：数据量大B：数据类型多C：价值密度低D：安全性要求高(正确答案)E：处理速度快大数据带来的主要挑战不包括哪一个：[单选题]*A：对现有数据库的挑战B：对实时性的技术挑战C：对数据中心和运维团队的挑战D：对成本的挑战(正确答案)下列关于hadoop的描述哪个是正确的：[单选题]*A：Hadoop的图标是一个黄色小鸭子；B：Hadoop是由韩国人研发的；C：CDH是hadoop的其中一个发行版本；(正确答案)D：所有的Hadoop发行版本都是免费的。以下哪个不属于hadoop的核心构成[单选题]*A:HDFSB:MapReduceC:Spark(正确答案)D:YARN以下哪个不属于hadoop生态圈内？[单选题]*A:HBaseB:ZookeeperC:FlumeD:Storm(正确答案)下列哪个不属于linux的发型版本？[单选题]*A：RedHatB:CentOsC:IOS(正确答案)D:Ubuntulinux执行vi进入编辑器，编辑完成之后需要保存并退出编辑模式，请问需要输入什么命令？[单选题]*A：:qB::wq(正确答案)C::q!D:Esc启动YARN后，默认的web访问端口是多少?[单选题]*A:8000B:9000C:8080D:8088(正确答案)下列哪个不属于Hadoop支持的文件系统[单选题]*A:HTTP(正确答案)B:HDFSC:HFTPD:FTPE:LocalHDFS的优点不包含哪个？[单选题]*A:处理超大文件B:运行于廉价机器上C:高效存储大量小文件(正确答案)D:流式的访问数据HDFS的设计目标不包括哪个？[单选题]*A:硬件错误B:大规模数据集C:移动计算D:移动数据(正确答案)HDFS默认的最基本的储存单位是？[单选题]*A:数据块(正确答案)B:元数据节点C:数据节点D:从元数据节点HDFS创建文件夹的命令是什么?[单选题]*A:$hadoopfs-mkdirfilename(正确答案)B:$hadoopfs-textfilenameC:$hadoopfs-putfilenameD:$hadoopfs-rmfilenameHDFS寻求帮助的命令格式是什...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

大数据分布并行处理试题及答案

大数据分布并行处理试题及答案RDD是Spark提供的核心抽象，全称为ResillientDistributedDataset，只能通过文件创建

[判断题]对错(正确答案)spark中的map和flatmap算子的区别是flatmap可以返回多条元素[判断题]对(正确答案)错下面哪个算子容易导致driver端内存溢出

[单选题]mapcountcollect(正确答案)take哪一种持久化策略表示只存储到内存，并且不序列化

[单选题]MEMORY_ONLY(正确答案)cache()MEMORY_AND_DISKMEMORY_ONLY_SERspark中的广播变量可以保证每个Executor内部只保存1份变量数据

[判断题]对错(正确答案)spark中在划分Stage的时候，遇到窄依赖就会划分出前后两个Stage

[判断题]对错(正确答案)spark中的持久化，只是将数据保存在内存中或者本地磁盘文件中，RDD的lineage(血缘关系)是不变的

[判断题]对(正确答案)错HBase属于基于键值对类型的NoSQL数据库

[判断题]对(正确答案)错针对HBase的应用场景的介绍，错误的是：[单选题]适合半结构和非结构数据适合存储记录稀疏的数据适合存储多版本数据适合海量数据分析(正确答案)HBase中不支持数字和字符串数据类型

[判断题]对(正确答案)错HBase中，每一行数据中的Rowkey字段不是必须的，可以为null

[判断题]对错(正确答案)HBase中在建表的时候，列族必须指定，并且后期无法修改

[判断题]对错(正确答案)HBase中，针对具有多个历史版本数据的字段，会按照时间戳正序排序

[判断题]对错(正确答案)HBase中的数据是按照Rowkey正序排序存储的

[判断题]对(正确答案)错向HBase的表t1中添加数据，写法正确的是：[单选题]put't1&#0

您可能关注的文档

文达天下 + 关注: 实名认证
内容提供者

各类试题、文摘、指南、行业规范

收藏店铺进入空间

大数据分布并行处理试题及答案 VIP免费

大数据分布并行处理试题及答案

您可能关注的文档

相关文档

热门下载

相关标签