CDA LEVEL Ⅱ建模分析师_模拟题:一、单项选择题(每小题 0
5 分,共 30 分)1、答案(D)在使用历史数据构造训练集(Train)集、验证(Validation)集和检验(Test)时,以下哪个样本量分配方案比较适合
训练 50%,验证 0%,检验 50%B
训练 100%,验证 0%,检验 0%C
训练 0%,验证 100%,检验 0%D
训练 60%,验证 30%,检验 10%2、答案(A)一个累积提升度曲线,当深度(Depth)等于 0
1 时,提升度为(Lift)为 3
14,以下哪个解释正确
根据模型预测,从最高概率到最低概率排序后,最高的前 10%中发生事件的数量比随机抽样的响应率高 3
选预测响应概率大于 10%的样本,其发生事件的数量比随机抽样的响应率高 3
根据模型预测,从最高概率到最低概率排序后,最高的前 10%中预测的精确度比随机抽样高 3
选预测响应概率大于 10%的样本,其预测的精确度比随机抽样高 3
143、答案(C)在 使 用 历 史 数 据 构 造 训 练 ( Train) 集 、验证( Validation) 集 和检验( Test)集 时,训 练 数 据 集 的作用 在 于A
用 于对模型的效果进行无偏的评估B
用 于比较不同模型的预测准确度C
用 于构 造 预测模型D
用 于选择模型4、答案( D)在 对历 史 数 据 集 进行分区之前进行数 据 清洗( 缺失值填补等) 的缺点是什么
增加了填补缺失值的时间B
加大了处理的难度C
无法针对分区后各个数 据 集 的特征分别做数 据 清洗D
无法对不同数 据 清理的方法进行比较,以选择最优方法5、答案( C)关于数 据 清洗( 缺失值、异常值) ,以下哪个叙述是正确的
运用 验证数 据 集 中变量的统计量对训 练 集 中的变量进行数 据