电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

Netflix基于AWS的大数据平台Hadoop架构解析

Netflix基于AWS的大数据平台Hadoop架构解析_第1页
1/6
Netflix基于AWS的大数据平台Hadoop架构解析_第2页
2/6
Netflix基于AWS的大数据平台Hadoop架构解析_第3页
3/6
Netflix 基于 AWS 的大数据平台 Hadoop 架构解析摘要:Netflix 近日在官方的博客上的公开了部署在 AWS 之上的 Hadoop 平台架构,而且该架构还是属于“独家制造”。Netflix 的数据科学家在官方的博客中介绍了该平台在运行、管理以及访问多集群时的灵活性,还包括基于 AWS 的Hadoop 架构以及 Hadoop 平台即服务(PaaS)。【CSDN 报道】Netflix 近日公开了部署在 AWS 之上的 Hadoop 平台架构,而且运行 Hadoop 工作负载的架构还是属于“独家制造"。来自 Netflix 的数据科学家Sriram Krishnan 和 Eva Tse 在官方的博客中介绍了该平台在运行、管理以及访问多集群时的灵活性,还包括基于 AWS 的 Hadoop 架构以及 Hadoop 平台即服务(PaaS),该服务被称之为“Genie"。毋庸置疑,Netflix 在云计算领域有着很独特的进展——几乎把所有的一切都部署在 AWS 平台之上;除此之外,Netflix 已经把触角深化到大数据工作负载的领域.Netflix 是一个“重量级"的 Hadoop 用户,在 2025 年 6 月份 Gigaom 的记者Derrick Harris 就撰文阐述了 Netflix 如何收集用户的数据,进而使用一些方法来对这些数据进行分析,而正是 Hadoop 在存储以及处理这些数据时为 Netflix 立下了“汗马功劳”。对该技术博客的编译如下:云端:Hadoop 平台即服务Hadoop 在管理和处理数百 TB 到 PB 级数据上的能力,已经成为事实上的标准。在 Netflix 中,基于 Hadoop 的数据仓库已经是 PB 级的规模,而且增长迅速.不过随着大数据时代的爆发,这也不是什么新奇事。然而该架构是独一无二的,它可以帮助 Netflix 在云端构建一个几乎是无限规模的数据仓库.(无论是数据的处理还是计算能力都很强大)在本文中 Sriram 和 Eva 讨论这个基于云的数据仓库,阐述了它和传统基于数据中心 Hadoop 架构的不同之处;还有他们是如何利用弹性云来构建这个具有动态扩展性的系统。与此同时,他们还介绍了 Genie,这是自家的 Hadoop 平台服务(PaaS),而且为作业执行和资源管理提供了一个 REST-ful API。架构视图传统的基于数据中心的 Hadoop 数据仓库,数据被托管在 HDFS 上,HDFS 能够运行在标准硬件之上,提供高容错性和高吞吐量的大型数据集的访问。在云端搭建 Hadoop 数据仓库最经典的方式应该遵循这个模式,只不过是把数据存储在(基于云的 Hadoop 集群)HDFS 之上。然而,就像在下一节描述的那样,他们选择把所有的...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

Netflix基于AWS的大数据平台Hadoop架构解析

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部