南开大学2021年9月《数据科学导论》作业考核试题及答案参考1.借助于大数据提供的()和(),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果参考答案:AB2.一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。()A.正确B.错误参考答案:A3.Apriori算法的计算复杂度受()影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD4.K-means算法采用贪心策略,通过迭代优化来近似求解。()A.正确B.错误参考答案:A5.下列不是Python对文件进行读操作的方法是()。A.readtextB.readlinesC.readD.readline参考答案:A6.NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。7.以下哪一项不属于数据变换?()A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C8.DHTML技术主要包括哪些?DHTML技术主要包括哪些?参考答案:样式表;内容的定位;动态内容;数据绑定;可下载的字体9.以下选项中,不是Python对文件的打开模式的是()。A.c'B.'r+'C.'w'D.'r'参考答案:A10.剪枝是决策树学习算法对付“过拟合”的主要手段。()A.正确B.错误参考答案:A11.地下城与勇士(DNF)公会技能可以清除后重新点不?地下城与勇士(DNF)公会技能可以清除后重新点不?当前版本中,公会的技能在学习后,无法进行清除和重新学习,还请了解,谢谢!12.一元线性回归中,真实值与预测值的差称为样本的()。A.误差B.方差C.测差D.残差参考答案:D13.地下城与勇士(DNF)TS警告码(x,42,x)是什么意思?地下城与勇士(DNF)TS警告码(x,42,x)是什么意思?建议您及时使用杀毒软件或者在这里下载腾讯游戏木马专杀工具进行查杀。如无法解决,可尝试暂时关闭杀软并重启机器后再试。14.关于函数,以下描述错误的是()。A.函数能完成特定的功能,对函数的使用不需要了解函数内部实现原理,只要了解函数的输入输出方式即可B.使用函数的主要目的是降低编程难度和代码重用C.函数是一段具有特定功能的、可重用的语句组D.Python中使用del关键字定义一个函数参考答案:D15.麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。()T.对F.错参考答案:T16.下面变量名称命名合法的是()。A._tempStrB.isC.2018pythonD.123Python参考答案:A17.在Python3.5中,集合类型的各个元素之间存在先后顺序。()A.正确B.错误参考答案:B18.数据科学具有哪些性质?()A.有效性B.可用性C.未预料D.可理解参考答案:ABCD19.数据可根据产生主体的不同分为两类少量企业应用产生的数据和量个人用户产生的数据。()T.对F.错参考答案:F20.当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。()A.正确B.错误参考答案:B21.函数用于从控制台输入数据,print函数用于将数据输出到控制台显示。()A.正确B.错误参考答案:A22.以下关于Python组合数据类型描述错误的是()。A.序列类型可以通过序号访问元素,元素之间不存在先后关系B.组合数据类型可以分为3类序列类型、集合类型和映射类型C.Python组合数据类型能够将多个同类型或者不同类型的数据组织起来,通过单一的表示使数据操作更有序、更容易D.Python中字符串、元组和列表都是序列类型参考答案:A23.按照数据量的大小,可将数据分析分为()A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析参考答案:ABC24.去除噪声使得数据光滑的技术主要有:()A.分箱B.回归C.离群点分析参考答案:ABC25.结构化数据是用excel结构表现的数据。()T.对F.错参考答案:F26.下面标识符中不是Python语言的关键字的是()。A.floatB.exceptC.continueD.global参考答案:A27.关联规则可以用枚举的方法产生。()A.正确B.错误参考答案:A28.集中趋势能够表明在一定条件下数据的独特性质与差异。()A.正确B.错误参考答案:B29.对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。()A.正确B.错误参考答案:A30.多元线性回归是线性回归的扩充,其中涉及的属性多于两个,并且数据拟合到一个多维曲面。()T.对F.错参考答案:T