第1页共9页衡阳师范学院2018-2019学年第一学期计算机科学与技术学院网络工程专业2016级《云计算与大数据处理原理》期末考试试题B卷考试时间:120分钟题号一二三四总分合分人复查人分值20203030100得分一、单选题(每小题2分,共20分)1.云计算是对技术的发展与运用()A、并行计算B、分布式计算C、网格计算D、以上都是2.从研究现状上看,下面不属于云计算特点的是()A.超大规模B.虚拟化C.私有化D.高可靠性3.以下哪项不.是大数据的特点()A、数据量大B、数据类型多样C、价值密度高D、处理速度快4.与SaaS不同的,这种“云”计算形式把开发环境或者运行平台也作为一种服务给用户提供。()A.PaaSB.DaaSC.IaaSD.CaaS5.HDfS中的block默认保存几份?()A、4B、3C、2D、16.下列哪项通常是集群的最主要的性能瓶颈()A.CPUB.网络学院专业年级、班级学号姓名得分评卷人第2页共9页C.磁盘D.内存7.在HDFS文件系统中,若块的大小是128M,有三个文件的大小分别是150M、190M和180M,则共需要分几个块存储()A、4B、5C、6D、78.下列哪种数据库不是NoSQL数据库()A.MongodbB.RedisC.MySQLD.HBase9.下列哪项不是聚类算法。()A、KNNB、K-中心点C、K-meansD、DBScan10.关于SecondaryNameNode,哪项是正确的?()A、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点二、填空题(每空2分,共20分)1.按技术路线来看,VMware属于云计算(填资源整合型或资源切分型)。2.大数据的两大核心技术是分布式存储和。3.MapReduce负责任务分配和调度的节点称为,负责任务执行的节点称为。4.聚类算法可分为层次聚类法、、和基于模型的方法等。5.决策树是用样本的作为结点,用作为分支的树得分评卷人第3页共9页结构。6、给定贝叶斯公式P(cj|x)=(P(x|cj)P(cj))/P(x),公式中P(cj|x)称为(填先验概率、后验概率或全概率)。朴素贝叶斯分类分类的依据是要求上式中的值最大。三、简答题(每小题5分,共30分)1.简述MapReduce中JobTracker、TaskTracker之间的关系。2.SecondaryNameNode是否应与NameNode部署到同一个节点上,为什么?3.简述MapReduce的Shuffle过程。得分评卷人第4页共9页4.人工神经网络输入层的节点数目和输出层的节点数目如何确定?5.对于用户ABCD和物品abcd,设N(A)={a,b,d},N(B)={a,c},N(C)={b,e},N(D)={c,d,e},各用户对各物品的感兴趣程度均为1,推荐阈值为0.5。试用基于物品的协同过滤推荐算法给用户A推荐物品。6.解释如下关联规则表达式的含义:major(a,“CS”)^takes(a,“DB”)→grade(a,“A”)[2%,75%]。第5页共9页四、应用题(每小题15分,共30分)1.给定事务数据如下表。假定数据包含频繁项集L={A,B,D}。问可以由L产生哪些关联规则,并分别列出其可信度(Confidence)?若最小可信度定义为75%,则产生的关联规则中哪些是强关关联规则。ID购买商品1{K,A,D,B}2{D,A,C,E,B}3{C,A,B,E}4{B,A,D}得分评卷人第6页共9页2.设有5个对象之间的距离如下表所示,试用层次聚类法将这些对象聚成两类,并画出聚类树状图。123451023.50346047520585630第7页共9页衡阳师范学院2018-2019学年第一学期计算机科学与技术学院网络工程专业2016年级《云计算与大数据处理原理》期末考试试题B卷答案及评分标准一、单选题(每小题2分,共20分)DCCABCBCAC二、填空题(每空2分,共20分)1.资源切分型2.分布式计算3JobTrackerTaskTracker4基于密度的聚类基于划分的聚类5属性属性值6后验概率P(x|cj)P(cj)三、简答题(每小题5分,共30分)1.简述MapReduce中JobTracker、TaskTracker之间的关系答:1.JobTracker:负责分配和调度任务。2.TaskTracker:负责执行任务。JobTracker应部署在一台单独的服务器上,TaskTracker应部署在DataNode节点上。2.SecondaryNameNode是否应与NameNode部署到同一个节点上,为什么?hadoop的集群是基于master/slave模式,namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,而slave有多个。SecondaryNameNode内存需求和NameNode在一个数量级上,所以通常seconda...