电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

南开大学《数据科学导论》20秋在线作业(夺分金卷)(参考答案) VIP免费

南开大学《数据科学导论》20秋在线作业(夺分金卷)(参考答案) _第1页
1/22
南开大学《数据科学导论》20秋在线作业(夺分金卷)(参考答案) _第2页
2/22
1.对于k近邻法,下列说法错误的是()。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则答案:C2.以下哪个不是处理缺失值的方法?()A.删除记录B.按照一定原则补充C.不处理D.随意填写答案:D3.在一元线性回归模型中,残差项服从()分布。A.泊松B.正态C.线性D.非线性答案:B4.一元线性回归中,真实值与预测值的差称为样本的()。A.误差B.方差C.测差D.残差答案:D5.Apriori算法的加速过程依赖于以下哪个策略?()A.抽样B.剪枝C.缓冲D.并行答案:B6.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()。A.异常值B.缺失值C.不一致的值D.重复值答案:C7.单层感知机模型属于()模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型答案:A8.层次聚类适合规模较()的数据集。A.大B.中C.小D.所有答案:C9.通过构造新的指标—线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化答案:C10.例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化答案:B11.在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。A.越小B.越大C.无关D.不确定答案:B12.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5};假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5答案:C13.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。A.1,线性B.2,线性C.1,非线性D.2,非线性答案:A14.实体识别属于以下哪个过程?()A.数据清洗B.数据集成C.数据规约D.数据变换答案:B15.通过变量标准化计算得到的回归方程称为()。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程答案:A16.我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左答案:B17.聚类是一种()。A.有监督学习B.无监督学习C.强化学习D.半监督学习答案:B18.利用最小二乘法对多元线性回归进行参数估计时,其目标为()。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差答案:C19.实体识别的常见形式:()A.同名异义B.异名同义C.单位不统一D.属性不同答案:D20.以下哪一项不属于数据变换?()A.简单函数变换B.规范化C.属性合并D.连续属性离散化答案:C21.距离度量中的距离可以是()。A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离答案:ABCD22.Apriori算法的计算复杂度受()影响。A.支持度阈值B.项数C.事务数D.事务平均宽度答案:ABCD23.K-means聚类中K值选取的方法是()。A.密度分类法B.手肘法C.大腿法D.随机选取答案:AB24.聚类的主要方法有()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类答案:ABC25.对于多层感知机,()层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层答案:BC26.什么情况下结点不用划分?()A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类答案:ABC27.下列选项是BFR的对象是()。A.废弃集B.临时集C.压缩集D.留存集答案:ACD28.系统日志收集的基本特征有()。A.高可用性B.高可靠性C.可扩展性D.高效率答案:ABC29.下面例子属于分类的是()。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量答案:ABC30.k近邻法的基本要素包括()。A.距离度量B.k值的选择C.样本大小D.分类决策规则答案:ABD31.一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

南开大学《数据科学导论》20秋在线作业(夺分金卷)(参考答案)

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部