电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

大数据分析实用教程——基于Python实现试卷18软工大数据A附答案VIP免费

大数据分析实用教程——基于Python实现试卷18软工大数据A附答案_第1页
1/9
大数据分析实用教程——基于Python实现试卷18软工大数据A附答案_第2页
2/9
大数据分析实用教程——基于Python实现试卷18软工大数据A附答案_第3页
3/9
第1页共9页衡阳师范学院2020-2021学年第一学期计算机科学与技术学院软件工程专业2018级云计算与大数据处理原理期末考试试题A卷考核类型:闭卷考核时量:120分钟题号一二三四总分分值15203530100得分一、单选题(每小题1分,共15分)1.关于大数据的特点,不.包括以下哪项()A、数据量大B、数据类型多样C、价值密度高D、数据真实性2.云计算的关键技术不.包括以下哪项()A、负载均衡B、虚拟化C、按需部署D、串行计算3.软件即服务的英文缩写是()A、PaaSB、SaaSC.IaaSD.CaaS4.按照虚拟化的层次,VirtualBox虚拟机属于()A.指令集架构虚拟化B.编程语言层虚拟化C.操作系统层虚拟化D.硬件抽象层虚拟化5.hθ(x)=θTX可作为下列哪种模型的方程()A、逻辑回归B、多元线性回归C、多重线性回归D、感知机模型6.MapReduce编程模型不.能解决的问题是()A.层次聚类法B.K-means聚类C.朴素贝叶斯分类D.TopK问题得分线封密学院专业班级学号姓名第2页共9页7.在MapReduce程序中,reduce()函数输出的数据格式是()A.字符串B.整型C.键值对D.数组8.下列哪项不属于分类算法:()A、K-中心点B、K近邻C、感知机模型D、逻辑回归模型9.若同一事务数据库中有两条关联规则:AC和CA,可知()A.它们的支持度一定相等B.它们的置信度一定相等C.它们的支持度一定不相等D.它们的置信度一定不相等10.在DBSCAN中,一个簇是一个的区域()A.密度可达B.直接密度可达C.密度相连D.直接密度相连11.关于MapReduce,下列说法错误的是()A.不同的Map任务之间不能互相通信B.MapReduce框架采用了Master/Slave架构C.Hadoop的单机模式无法运行MapReduce应用程序D.Map函数将输入的元素转换成形式的键值对12.一个三层的全连接神经网络,输入层有9个节点,隐含层有14个节点,输出层有1个节点,则总共有多少个连接权值()A.140B.280C.149D.12713.启动hadoop中hdfs进程的命令是()A.start-hadoop.shB.start-hdfs.shC.start-fs.shD.start-dfs.sh14.在机器学习训练过程中,要对下列哪种函数求解最优值()A.激活函数B.损失函数C.阈值函数D.正则化函数15.Linux中查看系统进程的命令是()A.sourceB.sudoC.bashrcD.jps第3页共9页二、填空题(每空2分,共20分)1.逻辑回归使用函数对线性回归进行了一个变换。2.train_test_split()函数的功能是把样本划分为训练集和。3.Yarn负责协调和管理整个集群资源的组件是,负责监视单个节点资源使用情况的组件是。4.回归与分类的区别是,回归的预测值是值(填连续或离数)。5.若某个消息出现的概率是0.25,则该消息携带的自信息量是。6.经典的决策树分类算法是,采用基尼指数作为决策依据的决策树分类算法是。7.Bagging重采样技术采用抽样(填有放回或无放回)。8.HDFS中的文件数据块(block)默认保存份。三、简答题(每小题5分,共35分)1.K-近邻分类算法中,K值表示什么?当K值从1逐渐增大时,分类结果的准确率是如何变化的?2.MapReduce计算分为哪4个阶段,各阶段的任务是什么。得分得分第4页共9页3.什么是训练集,聚类的训练集和分类的训练集有何区别?4.简述在Hadoop完全分布式模式下,主节点和从节点中会启动哪些和Hadoop相关的进程。5.在使用MapReduce程序WordCount进行词频统计时,对于文本行“hellohadoophelloworld”,请写出经过map()函数处理后输出的中间结果。6.神经网络的输入层和输出层的节点数如何确定?隐含层有什么作用?7.要将文件data.txt上传到HDFS文件系统的根目录下,然后将该文件从HDFS根目录下载到本机的~目录下。写出上述文件上传和下载的命令。第5页共9页四、应用题(每小题10分,共30分)1.试用下表的训练数据训练一个朴素贝叶斯模型,表中x1和x2为特征属性,取值集合分别为x1={1,2,3},x2={S,M,L},y为类别属性。并预测新样本x=(3,S)的类别值。123456789101112131415x1111112222233333x2SMMSSSMMLLLMMLLy0011000111111102.已知训练样本集如下表所示,试用C4.5算法构建决策树模型,通过颜色,形状判断属于哪种蔬菜。求:①熵H(蔬菜)、②条件熵H(蔬菜|形状)、③分裂信息split_info(颜色)。(写出对数运算式即可,不需计算最后的结果)颜色形状蔬菜红圆...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

大数据分析实用教程——基于Python实现试卷18软工大数据A附答案

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部