大数据开发基础(习题卷25)第1部分:单项选择题,共57题,每题只有一个正确答案,多选或少选均不得分。1.[单选题]如何禁用reduce阶段()A)设置conf.setNumreduceTasks(0)B)设置job.setNumreduceTasks(0)C)设置job.setNumreduceTasks()=0D)修改配置文件中NumreduceTasks=0答案:B解析:2.[单选题]字符串的strip方法的作用是()。A)删除字符串头尾指定的字符B)删除字符串末尾的指定字符C)删除字符串头部的指定字符D)通过指定分隔符对字符串切片答案:A解析:3.[单选题]下列表达式的值为True的是()A)5+4j>2-3jB)3>2==2C)e>5and4==fD)(x-6)>5答案:B解析:4.[单选题]启动hadoop所有进程的命令是()。A)start-dfs.shB)start-all.shC)start-hadoop.shD)start-hdfs.sh答案:B解析:5.[单选题]HBase中的批量加载底层使用()实现。A)MapReduceB)HiveC)CoprocessorD)BloomFilter答案:A解析:HBase批量导入两种方式:①利用MapReduce中封装好的方法。②利用Bulkload。6.[单选题]在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下哪些操作?A)执行HiveDDL操作。B)运行MapReduce任务C)运行HiveHQL任务题卷251/1D)以上全都正确答案:D解析:7.[单选题](__)为数据科学和大数据产业生态系统提供数据内容的捕获和获取服务。A)数据源和APPsB)数据资源C)数据端D)基础设施答案:A解析:8.[单选题]HBase架构的四大组件中,()分布式协调服务器。A)ZookeeperB)MasterC)RegionServerD)Client答案:A解析:9.[单选题]给定词汇表如下:{"Bob","ok","like","football","car"}。则下面句子“Botlikesfootball"的词袋模型表示为:A)[11100]B)[10110]C)[10010]D)[01101]答案:B解析:10.[单选题]关于HIVE的描述不正确的是?A)Hive最佳使用场景是大数据集的批处理作业B)Hive可以实现在大规模数据集上实现低延迟快速的查询、C)ive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作业提交和调度的时候需要大量的开销D)Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduceHadoop集群上答案:B解析:11.[单选题]Numpy中使用不同类型的数组进行操作时,结果数组的类型会进行()。A)向下转换B)向上转换C)不进行转换D)无法计算答案:B解析:在Numpy中,当使用不同类型的数组进行操作时,结果数组的类型对应于更一般或更精确的数组,称为向上转换的行为。12.[单选题]以下()选项是创建视图的默认算法。--A)UNDEFINEDB)MERGE题卷252/1C)TEMPTABLED)以上选项都不正确答案:A解析:13.[单选题]HIVE是由哪家公司发明并贡献到开源社区的A)GoogleB)FacebookC)twitterD)Amazon答案:B解析:14.[单选题]以下机器学习中,在数据预处理时,不需要考虑归一化处理的是:A)logistic回归B)SVMC)树形模型D)神经网络答案:C解析:15.[单选题]当我们构造线性模型时,我们注意变量间的相关性.在相关矩阵中搜索相关系数时,如果我们发现3对变量的相关系数是(Var1和Var2,Var2和Var3,Var3和Var1)是-0.98,0.45,1.23.我们可以得出什么结论:1.Var1和Var2是非常相关的2.因为Var1和Var2是非常相关的,我们可以去除其中一个3.Var3和Var1的1.23相关系数是不可能的A)1and3B)1and2C)1,2and3D)1答案:C解析:16.[单选题]在有N个节点FusionInsightHD集群中部署HBase时,推荐部署答案:个HMaster进程,()个RegionServer进程?A)3,NB)N,NC)2,ND)2,2答案:C解析:17.[单选题]泊松分布是离散型随机变量分布中相对较难的一种,泊松频率函数定义为(___)。A)P(X=k)=(λ^k*e^λ)/k!B)P(X=k)=e^k/k!C)p^x(1-p)^(1-x)D)(n!p^k*(1-p)^(n-k))/k!(n-k)!答案:A解析:18.[单选题]所有预测模型在广义上都可称为一个或一组()A)公式B)逻辑题卷253/1C)命题D)规则答案:D解析:19.[单选题]DELETE和TRUNCATE删除自动增长字段从1~4的所有值后,再次插入数据此字段的值分别为()。--A)1和1B)5和5C)1和5D)5和1答案:D解析:20.[单选题](__)是指能够通过数据来帮助用户实现其某一个目标的产品。A)数据产品B)电子产品C)数据系统D)电子系统答案:A解析:21.[单选题]HBase的一个典型...