中国移动网上大学《探索大数据和人工智能》题库整理Flume采用了三层架构,分别为agent,collector和(B)A
storageC
ShuffleD
HashSpark是在哪一年开源的
2000在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢
接口提供者D
数据采集学习没有标签的数据集的机器学习方法是
无监督学习C
半监督学习D
强化学习以下不是非结构化数据的项是
数据库二维表数据D
视频2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立(A)一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台
A首席数据官B
首席科学家C
首席执行官D
首席架构师整个MapReduce的过程大致分为Map、Shuffle、Combine、(A)
ReduceB
CleanD
Loading在Spak的软件栈中,用于交互式查询的是(A)A
SparkSQLB
MllibC
GraphXD
SparkStreaming在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系
(B)A数量越多处理时间越长B
数量越多处理时间越短C
数量越小处理时间越短D
没什么关系下列选项中,不是kafka适合的应用场景是
流式处理大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是(D)A
结构化数据B
非结构化数据C
半结构化数据D
全结构化数据下列选项中,不是人工智能的算法中的学习方法的是