一、 判断题(题数:15,共 15
0 分) 1
定量属性可以是整数值或者是连续值
( ) 正确答案: √ 2
分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error)
( ) 正确答案: √ 3
在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题
( ) 正确答案: × 4
在聚 类分析 当 中,簇 内 的相 似 性越 大,簇 间 的差别 越 大,聚 类的效 果 就 越 差
( ) 正确答案: × 5
聚 类分析 可以看 作 是一种非 监 督 的分类
( ) 正确答案: √ 6
如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点
( ) 正确答案: √ 7
允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差
( ) 正确答案: √ 8
召回率反映的是预测为正中的样本中正例的概率
( ) 正确答案: × 9
支 持 度 表 示 前 项 与 后 项 在 一个数据集 中同 时 出 现 的频 率
( ) 正确答案: √ 10
最 大最 小 值标 准 化 法 也 叫 极 值法 ,该方法 适 用于已 知 数据集 的最 小 值或最 大值情 况
( ) 正确答案: √ 11
波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的威胁、替代产品的威胁及企业内部的管理压力
( ) (1
0 分 正确答案: × 12
异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值
( ) 正确答案: × 13
数据可视化可以便于人们对数据的理解
( ) 正确答案: √ 14
大 数据思 维 , 是