1、2012 年 7 月, 为挖掘大数据的价值 , 阿里巴巴集团在管理层设立() 一职 , 负责全面推进“数据分享平台”战略, 并推出大型的数据分享平台
A首席数据官B
首席科学家C
首席执行官D
首席架构师2、整个 MapReduce的过程大致分为 Map、 Shuffle、 Combine、()
ReduceC
CleanD
Loading3、在 Spak 的软件栈中 , 用于交互式查询的是A
SparkSQLD
Spark Streaming4、在数据量一定的情况下 , MapReduce是一个线性可扩展模型 , 请问服务器数量与处 ( )理时间是什么关系
A数量越多处理时间越长B
数量越多处理时间越短C
数量越小处理时间越短D
没什么关系5、下列选项中 , 不是 kafka 适合的应用场景是
流式处理6、大数据的多样性使得数据被分为三种数据结构, 那么以下不是三种数据结构之一的是A
结构化数据B
非结构化数据C
半结构化数据D
全结构化数据7、下列选项中 , 不是人工智能的算法中的学习方法的是
对抗学习8、自然语言处理难点目前有四大类, 下列选项中不是其中之一的是A
语言歧义性C
语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习 , 其中监督学习是学习给定标签的数据集
请问标签为离散的类型 , 称为分类 , 标签为连续的类型 ,称为什么
回归10、中国移动自主研发、发布的首个人工智能平台叫做() A
OneNETC
大云11、HDFS中 Namenodef 的 Metadata 的作用是
描述数据的存储位置等属性B