大数据分布并行处理试题及答案

下载本文档

阅读 129
下载 1
格式 docx
大小 34.05 KB
约26页
2025-01-11 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/26页

2/26页

3/26页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/26

文本预览下载提示常见问题

大数据分布并行处理试题及答案RDD 是 Spark 提供的核心抽象，全称为 ResillientDistributedDataset,只能通过文件创建。［判断题］对错（正确答案）spark 中的 map 和 flatmap 算子的区别是 flatmap 可以返回多条元素［判断题］对（正确答案）错下面哪个算子容易导致 driver 端内存溢出？［单选题］mapcountcollect（正确答案）take哪一种持久化策略表示只存储到内存，并且不序列化。［单选题］MEMORY_ONLY 正确答案）cache（）MEMORY_AND_DISKMEMORY_ONLY_SERspark 中的广播变量可以保证每个 Executor 内部只保存 1 份变量数据。［判断题］对错（正确答案）spark 中在划分 Stage 的时候，遇到窄依赖就会划分出前后两个 Stage。［判断题］对错（正确答案）spark 中的持久化，只是将数据保存在内存中或者本地磁盘文件中，RDD 的lineage（血缘关系）是不变的。［判断题］对（正确答案）错HBase 属于基于键值对类型的 NoSQL 数据库。［判断题］对（正确答案）错针对 HBase 的应用场景的介绍，错误的是：［单选题］适合半结构和非结构数据适合存储记录稀疏的数据适合存储多版本数据适合海量数据分析（正确答案）HBase 中不支持数字和字符串数据类型。［判断题］对（正确答案）错HBase 中，每一行数据中的 Rowkey 字段不是必须的，可以为 null。［判断题］对错（正确答案）HBase 中在建表的时候，列族必须指定，并且后期无法修改。［判断题］对错（正确答案）HBase 中，针对具有多个历史版本数据的字段，会按照时间戳正序排序。［判断题］对错（正确答案）HBase 中的数据是按照 Rowkey 正序排序存储的。［判断题］对（正确答案）错向 HBase 的表 t1 中添加数据，写法正确的是：［单选题］put'tl','rowkeyl','info','abc'put'tl','rowkeyl','info','age:abc'put't1','rowkey1','level:abc','age:xyz'put't1','rowkey1','level:abc','xyz'（正确答案）HBase 中，如果一个列族中如果有 3 列，那么这 3 列会分到几个文件中存储？［单选题］1（正确答案）HRegionServer 包含了 HLog 和？［单选题］HRegion（正确答案）HMasterHDFSDataHStore 包含两部分：StoreFile 和？［单选题］HFileHRegionHMasterMemStore（正确答案）minor 合并时会忽略之前标记为删除状态的数据。［判断题］对错（正确答案）HBase 中，若 MemStore 中的数据有丢失，则可以从 HLog 上恢复。［判断题］对（正确答案）错HBase...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

大数据分布并行处理试题及答案

大数据分布并行处理试题及答案RDD 是 Spark 提供的核心抽象，全称为 ResillientDistributedDataset,只能通过文件创建

［判断题］对错（正确答案）spark 中的 map 和 flatmap 算子的区别是 flatmap 可以返回多条元素［判断题］对（正确答案）错下面哪个算子容易导致 driver 端内存溢出

［单选题］mapcountcollect（正确答案）take哪一种持久化策略表示只存储到内存，并且不序列化

［单选题］MEMORY_ONLY 正确答案）cache（）MEMORY_AND_DISKMEMORY_ONLY_SERspark 中的广播变量可以保证每个 Executor 内部只保存 1 份变量数据

［判断题］对错（正确答案）spark 中在划分 Stage 的时候，遇到窄依赖就会划分出前后两个 Stage

［判断题］对错（正确答案）spark 中的持久化，只是将数据保存在内存中或者本地磁盘文件中，RDD 的lineage（血缘关系）是不变的

［判断题］对（正确答案）错HBase 属于基于键值对类型的 NoSQL 数据库

［判断题］对（正确答案）错针对 HBase 的应用场景的介绍，错误的是：［单选题］适合半结构和非结构数据适合存储记录稀疏的数据适合存储多版本数据适合海量数据分析（正确答案）HBase 中不支持数字和字符串数据类型

［判断题］对（正确答案）错HBase 中，每一行数据中的 Rowkey 字段不是必须的，可以为 null

［判断题］对错（正确答案）HBase 中在建表的时候，列族必须指定，并且后期无法修改

［判断题］对错（正确答案）HBase 中，针对具有多个历史版本数据的字段，会按照时间戳正序排序

［判断题］对错（正确答案）HBase 中的数据是按照 Rowkey 正序排序存储的

［判断题］对（正确答案）错向 H

wxg + 关注: 实名认证
内容提供者

该用户很懒，什么也没介绍

收藏店铺进入空间

大数据分布并行处理试题及答案

大数据分布并行处理试题及答案

您可能关注的文档

相关文档

热门下载

相关标签