四川大学计算机学院、软件学院实验报告学号:姓名:专业:班级:9第15周课程名称云计算与分布式系统实验课时6实验项目在最终部署的Hadoop上运行WordCount程序实验时间2015年6月11日星期四实验目的1
首先通过Linux系统和KVM虚拟机的安装达成对Linux系统与虚拟机相关知识的了解和熟悉;2
通过Linux下JAVA-ADT的安装以及Hadoop的相关配置了解Hadoop的基础知识及基础的应用方法;3
通过多台主机的虚拟化以及Hadoop的联合部署,在该平台上运行WordCount程序,体验基本的云计算的雏形应用并加深对云计算相关知识的了解
实验环境硬件环境:PC机软件环境:Ubuntu镜像,Linux镜像以及KVM虚拟机程序包实验内容(算法、程序、步骤和方法)一、实验背景1
在云计算及其相关应用日益火爆的今天,我们通过课堂上老师讲述的云计算相关的基本知识,已经对于利用Hadoop的配置实现一个较为简单的云计算环境有了一定的认识,因此,在本课程的期末设计中,我们采用Linux下的Hadoop搭建来运行一些简单的程序比如Wordcount来达成对云计算的实现的基本知识的学习效果;2
本实验中使用的是MapReduce的编程模型,采用“分而治之”的基本思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果
简单地说,MapReduce就是"任务的分解与结果的汇总";3
在Hadoop中,用于执行MapReduce任务的机器角色有两个:一个是JobTracker;另一个是TaskTracker,JobTracker是用于调度工作的,TaskTracker是用于执行工作的
一个Hadoop集群中只有一台JobTracker;4
但是值得注意的一点是若要使用本实验中的MapReduce来处理数据集(或任务)