探索大数据和人工智能1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台
A首席数据官B
首席科学家C
首席执行官D
首席架构师2、整个MapReduce的过程大致分为Map、Shuffle、Combine、()
ReduceB
CleanD
Loading3、在Spak的软件栈中,用于交互式查询的是A
SparkSQLB
MllibC
GraphXD
SparkStreaming4、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处()理时间是什么关系
A数量越多处理时间越长B
数量越多处理时间越短C
数量越小处理时间越短D
没什么关系5、下列选项中,不是kafka适合的应用场景是
流式处理6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A
结构化数据B
非结构化数据C
半结构化数据D
全结构化数据7、下列选项中,不是人工智能的算法中的学习方法的是
对抗学习8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A
语言歧义性C
语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么
回归10、中国移动自主研发、发布的首个人工智能平台叫做()A
OneNETC
大云11、HDFS中Namenodef的Metadata的作用是
描述数据的存储位置等属性B
12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么