将OpenStack私有云部署到HadoopMapReduce环境中四种方案

下载本文档

阅读 169
下载 20
格式 pdf
大小 574.4 KB
约7页
2025-02-19 发布于天津市
收藏
评论
点赞(0)
海报
举报

将OpenStack私有云部署到HadoopMapReduce环境中四种方案_第1页

1/7页

将OpenStack私有云部署到HadoopMapReduce环境中四种方案_第2页

2/7页

将OpenStack私有云部署到HadoopMapReduce环境中四种方案_第3页

3/7页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

OpenStack 与 Hadoop 被誉为继 Linux之后最有可能获得巨大成功的开源项目。这二者如何结合成为更猛的新方案？业内给出两种答案：Hadoop 跑在 OpenStack 上或 OpenStack部署到 Hadoop 上。Steve Markey教授重点介绍了后者。这两种答案都有企业在实践。“Hadoop 跑在 OpenStack 上”可以参考《Project Savanna：让 Hadoop 运行在 OpenStack 之上》，“OpenStack 部署到 Hadoop 上”则重点可查阅本文。随着企业开始同时利用云计算和大数据技术，现在应当考虑如何将这些工具结合使用。在这种情况下，企业将实现最佳的分析处理能力，同时利用私有云的快速弹性 (rapid elasticity) 和单一租赁的特性。如何协同效用和实现部署，是本文希望解决的问题。一些基础知识第一是 OpenStack 。作为目前最流行的开源云版本，它包括控制器、计算 (Nova)、存储 (Swift)、消息队列 (RabbitMQ) 和网络 (Quantum) 组件。图 1 提供了这些组件的一个图示（不包含 Quantum 网络组件）。图 1. OpenStack 的组件这些组件共同提供了一个允许动态配给计算和存储资源的环境。从硬件角度看，这些服务可扩展到许多虚拟的和物理的服务器上。例如，大多数组织部署一个物理服务器作为控制器节点，部署另一个物理服务器作为计算节点。许多组织还选择将其存储环境分离到一个专用的物理服务器上，对于 OpenStack 部署而言，这意味着对 Swift 存储环境使用单独的服务器。第二是大数据。一般可以理解为三个数据源的数据汇集：传统数据（结构化数据）、感知数据（日志数据和元数据）和社交（社交媒体）数据。大数据通常采用新的技术模式进行存储，比如非关系分布式数据库 NoSQL。共有四种非关系数据库管理此系统 (NRDBMS)：基于列、关键值、图表和基于文档。这些 NRDBMS 将源数据聚集在一起，同时用 MapReduce 之类的分析程序对汇总的信息进行分析。传统的大数据环境包括一个分析程序、一个数据存储、一个可扩展文件系统、一个工作流管理器、一个分布式排序和散列解决方案以及一个数据流编程框架。常用于商业应用程序的数据流编程框架是 Structured Query Language (SQL)，对于开源应用程序，通常会使用 SQL 的替代方案，如 Apache Pig for Hadoop。在商用方面，Cloudera 提供了最稳定、最全面的解决方案之一，而 Apache Hadoop 是最流行的开源 Hadoop 版本。第三是Apache Hadoop 。包含多种组件...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

将OpenStack私有云部署到HadoopMapReduce环境中四种方案

OpenStack 与 Hadoop 被誉为继 Linux之后最有可能获得巨大成功的开源项目

这二者如何结合成为更猛的新方案

业内给出两种答案：Hadoop 跑在 OpenStack 上或 OpenStack部署到 Hadoop 上

Steve Markey教授重点介绍了后者

这两种答案都有企业在实践

“Hadoop 跑在 OpenStack 上”可以参考《Project Savanna：让 Hadoop 运行在 OpenStack 之上》，“OpenStack 部署到 Hadoop 上”则重点可查阅本文

随着企业开始同时利用云计算和大数据技术，现在应当考虑如何将这些工具结合使用

在这种情况下，企业将实现最佳的分析处理能力，同时利用私有云的快速弹性 (rapid elasticity) 和单一租赁的特性

如何协同效用和实现部署，是本文希望解决的问题

一些基础知识第一是 OpenStack

作为目前最流行的开源云版本，它包括控制器、计算 (Nova)、存储 (Swift)、消息队列 (RabbitMQ) 和网络 (Quantum) 组件

图 1 提供了这些组件的一个图示（不包含 Quantum 网络组件）

OpenStack 的组件这些组件共同提供了一个允许动态配给计算和存储资源的环境

从硬件角度看，这些服务可扩展到许多虚拟的和物理的服务器上

例如，大多数组织部署一个物理服务器作为控制器节点，部署另一个物理服务器作为计算节点

许多组织还选择将其存储环境分离到一个专用的物理服务器上，对于 OpenStack 部署而言，这意味着对 Swift 存储环境使用单独的服务器

第二是大数据

一般可以理解为三个数据源的数据汇集：传统数据（结构化数据）、感知数据（日志数据和元数据）和社交（社交媒体）数据

大数据通常采用新的技术模式进行存储，比如非关系分布式数据库

小辰 + 关注: 实名认证
内容提供者

出售各种文档和资料

收藏店铺进入空间

将OpenStack私有云部署到HadoopMapReduce环境中四种方案

将OpenStack私有云部署到HadoopMapReduce环境中四种方案

您可能关注的文档

相关文档

热门下载

相关标签