Hadoop云计算实验报告

下载本文档

阅读 108
下载 9
格式 docx
大小 1.09 MB
约12页
2025-01-28 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/12页

2/12页

3/12页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/12

文本预览下载提示常见问题

下载后可任意编辑Hadoop 云计算实验报告下载后可任意编辑Hadoop 云计算实验报告1实验目的在虚拟机 Ubuntu 上安装 Hadoop 单机模式和集群；编写一个用 Hadoop 处理数据的程序，在单机和集群上运行程序。2实验环境虚拟机：VMware 9操作系统：ubuntu-12.04-server-x64（服务器版），ubuntu-14.10-desktop-amd64（桌面版）Hadoop 版本：hadoop 1.2.1Jdk 版本：jdk-7u80-linux-x64Eclipse 版本：eclipse-jee-luna-SR2-linux-gtk-x86_64Hadoop 集群：一台 namenode 主机 master，一台 datanode 主机 salve，master 主机 IP 为 10.5.110.223，slave 主机 IP 为 10.5.110.207。3实验设计说明3.1主要设计思路在 ubuntu 操作系统下，安装必要软件和环境搭建，使用 eclipse 编写程序代码。实现大数据的统计。本次实验是统计软件代理系统操作人员处理的信息量，即每个操作人员出现的次数。程序设计完成后，在集成环境下运行该程序并查看结果。3.2算法设计该算法首先将输入文件都包含进来，然后交由 map 程序处理，map 程序将输入读入后切出其中的用户名，并标记它的数目为 1，形成的形式，然后交由 reduce 处理，reduce 将相同 key 值(也就是 word)的 value 值收集起来，形成的形式，之后再将这些 1 值加起来，即为用户名出现的个数，最后将这个对以TextOutputFormat 的形式输出到 HDFS 中。3.3程序说明下载后可任意编辑1) UserNameCountMap 类继承了 org.apache.hadoop.mapreduce.Mapper，4 个泛型类型分别是 map 函数输入 key 的类型，输入 value 的类型，输出 key 的类型，输出 value 的类型。2) UserNameCountReduce 类继承了 org.apache.hadoop.mapreduce.Reducer，4 个泛型类型含义与 map 类相同。3) main 函数通过 addInputPath 将数据文件引入该类，在通过 setOutputPath 将生成结果转为一个文件，实现生成结果，即统计结果的查看。 FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); 程序具体代码如附件中源程序。4实验过程4.1安装实验环境 4.1.1安装 ubuntu 操作系统1)打开 VMware,在 Home tab 中单击“Create a New Virtual Machine”，2)选择 custom，选择虚拟硬件版本 Workstation9.0，选择 ios 文件，next，3)录入目标操作系统信息...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

Hadoop云计算实验报告

下载后可任意编辑Hadoop 云计算实验报告下载后可任意编辑Hadoop 云计算实验报告1实验目的在虚拟机 Ubuntu 上安装 Hadoop 单机模式和集群；编写一个用 Hadoop 处理数据的程序，在单机和集群上运行程序

2实验环境虚拟机：VMware 9操作系统：ubuntu-12

04-server-x64（服务器版），ubuntu-14

10-desktop-amd64（桌面版）Hadoop 版本：hadoop 1

1Jdk 版本：jdk-7u80-linux-x64Eclipse 版本：eclipse-jee-luna-SR2-linux-gtk-x86_64Hadoop 集群：一台 namenode 主机 master，一台 datanode 主机 salve，master 主机 IP 为 10

223，slave 主机 IP 为 10

3实验设计说明3

1主要设计思路在 ubuntu 操作系统下，安装必要软件和环境搭建，使用 eclipse 编写程序代码

实现大数据的统计

本次实验是统计软件代理系统操作人员处理的信息量，即每个操作人员出现的次数

程序设计完成后，在集成环境下运行该程序并查看结果

2算法设计该算法首先将输入文件都包含进来，然后交由 map 程序处理，map 程序将输入读入后切出其中的用户名，并标记它的数目为 1，形成的形式，然后交由 reduce 处理，reduce 将相同 key 值(也就是 word)的 value 值收集起来，形成的形式，之后再将这些 1 值加起来，即为用户名出现的个数，最后将这个对以TextOutputFormat 的形式输出到 HDFS 中

3程序说明下载后可任意编辑1) UserNameCountMap 类继承了 org

apache

hadoop

mapreduce

一帆文传 + 关注: 实名认证
内容提供者

欢迎光临店铺，各类公文供您挑选。

收藏店铺进入空间

Hadoop云计算实验报告

Hadoop云计算实验报告

您可能关注的文档

相关文档

热门下载

相关标签