Hadoop-体系架构（非常完整）VIP免费

下载本文档

阅读 120
下载 3
格式 docx
大小 11.51 MB
约87页
2024-11-26 发布于陕西
收藏
评论
点赞(0)
海报
举报

1/87页

2/87页

3/87页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/87

文本预览下载提示常见问题

Hadoop 体系架构Yarn 架构Hadoop 和 MRv1 简单介绍Hadoop 集群可从单一节点（其中所有 Hadoop 实体都在同一个节点上运行）扩展到数千个节点（其中的功能分散在各个节点之间，以增加并行处理活动）。图 1 演示了一个 Hadoop 集群的高级组件。图 1. Hadoop 集群架构的简单演示一个 Hadoop 集群可分解为两个抽象实体：MapReduce 引擎和分布式文件系统。MapReduce 引擎能够在整个集群上执行 Map 和 Reduce 任务并报告结果，其中分布式文件系统提供了一种存储模式，可跨节点复制数据以进行处理。Hadoop 分布式文件系统 (HDFS) 通过定义来支持大型文件（其中每个文件通常为 64 MB 的倍数）。当一个客户端向一个 Hadoop 集群发出一个请求时，此请求由 JobTracker 管理。JobTracker 与 NameNode 联合将工作分发到离它所处理的数据尽可能近的位置。NameNode 是文件系统的主系统，提供元数据服务来执行数据分发和复制。JobTracker 将 Map 和 Reduce 任务安排到一个或多个 TaskTracker 上的可用插槽中。TaskTracker 与 DataNode（分布式文件系统）一起对来自 DataNode 的数据执行 Map 和 Reduce 任务。当 Map 和 Reduce 任务完成时，TaskTracker 会告知 JobTracker，后者确定所有任务何时完成并最终告知客户作业已完成。InfoSphere BigInsights Quick Start EditionInfoSphere BigInsights Quick Start Edition 是 IBM 基于 Hadoop 的产品 InfoSphere BigInsights 的一个免费可下载版本。使用 Quick Start Edition，您可尝试 IBM 开发的特性来扩大开源 Hadoop 的价值，比如 Big SQL、文本分析和 BigSheets。引导式学习可让您的体验尽可能顺畅，包括按部就班、自定进度的教程和视频，可以帮助开始让 Hadoop 为您所用。没有时间或数据限制，您可自行安排时间在大量数据上进行试验。请观看视频、学习教程 (PDF) 和下载 BigInsights Quick Start Edition 。从图 1 中可以看到，MRv1 实现了一个相对简单的集群管理器来执行 MapReduce 处理。MRv1 提供了一种分层的集群管理模式，其中大数据作业以单个 Map 和 Reduce 任务的形式渗入一个集群，并最后聚合成作业来报告给用户。但这种简单性有一些隐秘，不过也不是很隐秘的问题。MRv1 的缺陷MapReduce 的第一个版本既有优点也有缺点。MRv1 是目前使用的标准的大数据处理系统。但是，这种架构存在不...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

Hadoop-体系架构（非常完整）

Hadoop 体系架构Yarn 架构Hadoop 和 MRv1 简单介绍Hadoop 集群可从单一节点（其中所有 Hadoop 实体都在同一个节点上运行）扩展到数千个节点（其中的功能分散在各个节点之间，以增加并行处理活动）

图 1 演示了一个 Hadoop 集群的高级组件

Hadoop 集群架构的简单演示一个 Hadoop 集群可分解为两个抽象实体：MapReduce 引擎和分布式文件系统

MapReduce 引擎能够在整个集群上执行 Map 和 Reduce 任务并报告结果，其中分布式文件系统提供了一种存储模式，可跨节点复制数据以进行处理

Hadoop 分布式文件系统 (HDFS) 通过定义来支持大型文件（其中每个文件通常为 64 MB 的倍数）

当一个客户端向一个 Hadoop 集群发出一个请求时，此请求由 JobTracker 管理

JobTracker 与 NameNode 联合将工作分发到离它所处理的数据尽可能近的位置

NameNode 是文件系统的主系统，提供元数据服务来执行数据分发和复制

JobTracker 将 Map 和 Reduce 任务安排到一个或多个 TaskTracker 上的可用插槽中

TaskTracker 与 DataNode（分布式文件系统）一起对来自 DataNode 的数据执行 Map 和 Reduce 任务

当 Map 和 Reduce 任务完成时，TaskTracker 会告知 JobTracker，后者确定所有任务何时完成并最终告知客户作业已完成

InfoSphere BigInsights Quick Start EditionInfoSphere BigInsights Quick Start Edition 是 IBM 基于 Hadoop 的产品 InfoSphere BigInsights 的一个免费可下载版本

最好的沉淀 + 关注: 实名认证
内容提供者

行业文档

收藏店铺进入空间

Hadoop-体系架构（非常完整）VIP免费

Hadoop-体系架构（非常完整）

您可能关注的文档

相关文档

热门下载

相关标签