一、判断题(题数:15,共15
定量属性可以是整数值或者是连续值
()正确答案:√2
分类模型的误差大致分为两种:训练误差(trainingerror)和泛化误差(generalizationerror)
()正确答案:√3
在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题
()正确答案:×4
在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差
()正确答案:×5
聚类分析可以看作是一种非监督的分类
()正确答案:√6
如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点
()正确答案:√7
允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差
()正确答案:√8
召回率反映的是预测为正中的样本中正例的概率
()正确答案:×9
支持度表示前项与后项在一个数据集中同时出现的频率
()正确答案:√10
最大最小值标准化法也叫极值法,该方法适用于已知数据集的最小值或最大值情况
()正确答案:√11
波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的威胁、替代产品的威胁及企业内部的管理压力
0分正确答案:×12
异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值
()正确答案:×13
数据可视化可以便于人们对数据的理解
()正确答案:√14
大数据思维,是指一种意识,认为公开的数据一旦处理得当可以为人类急需解决的问题提供答案
()正确答案:√15
资金本身具有时间价值
()正确答案:×二、单选题(题数:30,共45
某超市研究销售记录发现,购买牛奶的人很大概率会购买面包,这种属于数据挖掘的哪类