龙源期刊网http://www
cn典型大数据计算框架分析ﻫ作者:赵晟姜进磊ﻫ来源:《中兴通讯技术》2016年第02期摘要:认为大数据计算技术已逐渐形成了批量计算和流计算两个技术发展方向
批量计算技术主要针对静态数据的离线计算,吞吐量好,但是不能保证实时性;流计算技术主要针对动态数据的在线实时计算,时效性好,但是难以获取数据全貌
从可扩展性、容错性、任务调度、资源利用率、时效性、输入输出(IO)等方面对现有的主流大数据计算框架进行了分析与总结,指出了未来的发展方向和研究热点
关键词:大数据分类;大数据计算;批量计算;流计算;计算框架Abstract:Bigdatacomputingtechnologieshavetwotypicalprocessingmodes:batchcomputingandstreamcomputing.Batchcomputingismainlyusedforhigh-throughputprocessingofstaticdataanddoesnotproduceresultsinrealtime
Streamcomputingisusedforprocessingdynamicdataonlineinrealtimebuthasdifficultyprovidingafullviewofdata
Inthispaper,weanalyzesometypicalbigdatacomputingframeworksfromtheperspectiveofscalability,fault-tolerance,taskscheduling,resourceutilization,realtimeguarantee,andinput/output(IO)overhead
Wethenpointsoutsomefuturetrends