22春学期(高起本1709-1803、全层次1809-2103)《数据科学导论》在线作业-00002试卷总分:100得分:100一、单选题(共20道试题,共40分)1
聚类是一种()
有监督学习B
无监督学习C
半监督学习答案:B2
一元线性回归中,真实值与预测值的差称为样本的()
残差答案:D3
对于k近邻法,下列说法错误的是()
不具有显式的学习过程B
适用于多分类任务C
k值越大,分类效果越好D
通常采用多数表决的分类决策规则答案:C4
某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1
2X,这说明()
产量每增加一台,单位成本增加100元B
产量每增加一台,单位成本减少1
产量每增加一台,单位成本平均减少1
产量每增加一台,单位平均增加100元答案:C5
哪一项不属于规范化的方法()A
最小-最大规范化B
零-均值规范化C
小数定标规范化D
中位数规范化答案:D6
迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系
其中,数据之间的相关关系可以通过以下哪个算法直接挖掘()A
K-meansB
BayesNetworkC
Apriori答案:D7
在回归分析中,自变量为(),因变量为()
离散型变量,离散型变量B
连续型变量,离散型变量C
离散型变量,连续型变量D
连续型变量,连续型变量答案:D8
层次聚类适合规模较()的数据集A
所有答案:C9
BFR聚类是用于处理数据集()的k-means变体
所有答案:A10
手肘法的核心指标是()