下载后可任意编辑基于 MapReduce 算法的大数据技术讨论摘要:文章提出了一种基于 MapReduce 的优化编程框架,来进行数据挖掘与处理
MapReduce 是通过执行Map 和 Reduce 两个阶段把大数据分割成小数据族,再并行处理这些小数据族输出得到我们想要的结果
优化过的 MapReduce 加快了数据处理速度,提高了大数据处理效率
所有的数据存储于 HDFS 中,为了方便编程人员高效地对存储好的数据进行查询和处理,Hive 提供了一套 SQL 数据操作语言,并将其转换成MapReduce 程序执行
改进的大数据算法具有更快地数据处理速度,更准确的数据查询能力
关键词:大数据;数据挖掘;数据处理;MapReduce;Hive下载后可任意编辑Research of big data technology based on MapReduce algorithmAbstract:This paper presents an optimization-based MapReduce programming framework for data mining and processing
MapReduce is through the implementation of Map and Reduce in two phases to split large data into smaller data clan, then the parallel processing of these small family of data output to get the results we want
Optimized MapReduce speed up data processing speed, improve the efficiency of large