电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

实验3-MapReduce编程初级实践

实验3-MapReduce编程初级实践_第1页
1/6
实验3-MapReduce编程初级实践_第2页
2/6
实验3-MapReduce编程初级实践_第3页
3/6
实验 3 MapReduce 编程初级实践1.实验目的1.通过实验掌握基本的 MapReduce 编程方法;2。掌握用 MapReduce 解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等。2.实验平台已经配置完成的 Hadoop 伪分布式环境.3.实验内容和要求1.编程实现文件合并和去重操作对于两个输入文件,即文件 A 和文件 B,请编写 MapReduce 程序,对两个文件进行合并,并剔除其中重复的内容,得到一个新的输出文件 C.下面是输入文件和输出文件的一个样例供参考.实验最终结果(合并的文件):代码如下:package com.Merge;import java。io。IOException;import org。apache.hadoop。conf。Configuration;import org.apache.hadoop。fs。Path;import org.apache。hadoop。io。Text;import org.apache。hadoop.mapreduce.Job;import org.apache。hadoop.mapreduce。Mapper;import org.apache。hadoop。mapreduce。Reducer;import org.apache.hadoop。mapreduce。lib。input。FileInputFormat;import org。apache。hadoop。mapreduce.lib。output.FileOutputFormat;public class Merge { public static class Map extends Mapper values, Context context) throws IOException, InterruptedException { context。write(key, new Text("”)); } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); conf。set(”fs。defaultFS”, "hdfs://localhost:9000”); String[] otherArgs = new String[] { ”input”, ”output” }; if (otherArgs。length != 2) { System。err。println(”Usage: Merge and duplicate removal 〈in〉 〈out>”); System.exit(2); } Job job = Job.getInstance(conf, "Merge and duplicate removal"); job.setJarByClass(M...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

实验3-MapReduce编程初级实践

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部