实验3-MapReduce编程初级实践

下载本文档

阅读 121
下载 6
格式 doc
大小 123 KB
约6页
2025-09-04 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/6页

2/6页

3/6页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

实验 3 MapReduce 编程初级实践1.实验目的1.通过实验掌握基本的 MapReduce 编程方法;2。掌握用 MapReduce 解决一些常见的数据处理问题，包括数据去重、数据排序和数据挖掘等。2.实验平台已经配置完成的 Hadoop 伪分布式环境.3.实验内容和要求1.编程实现文件合并和去重操作对于两个输入文件，即文件 A 和文件 B，请编写 MapReduce 程序，对两个文件进行合并,并剔除其中重复的内容，得到一个新的输出文件 C.下面是输入文件和输出文件的一个样例供参考.实验最终结果（合并的文件）:代码如下：package com.Merge;import java。io。IOException；import org。apache.hadoop。conf。Configuration;import org.apache.hadoop。fs。Path;import org.apache。hadoop。io。Text;import org.apache。hadoop.mapreduce.Job；import org.apache。hadoop.mapreduce。Mapper;import org.apache。hadoop。mapreduce。Reducer;import org.apache.hadoop。mapreduce。lib。input。FileInputFormat；import org。apache。hadoop。mapreduce.lib。output.FileOutputFormat;public class Merge { public static class Map extends Mapper values, Context context) throws IOException， InterruptedException ｛ context。write(key, new Text("”))； } ｝ public static void main（String［］ args） throws Exception ｛ Configuration conf = new Configuration（)； conf。set（”fs。defaultFS”， "hdfs：//localhost：9000”）; String［] otherArgs = new String［] ｛ ”input”, ”output” ｝； if (otherArgs。length ！= 2） { System。err。println（”Usage: Merge and duplicate removal 〈in〉〈out>”）; System.exit(2）; ｝ Job job = Job.getInstance（conf， "Merge and duplicate removal"); job.setJarByClass(M...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容