一、单项选择题(每小题2分,共30分)1
影响数据质量问题的因素有哪些
准确性、完整性、一致性B
相关性、时效性C
可信性、可解释性D
假设有这么一组排序后的数据:4,8,15,21,21,24,25,28,34,划分为等频的箱:箱1:4,8,15;箱2:21,21,24;箱3:25,28,34,要求:箱1用平均值,箱2用中位值,箱3用箱边界三种方法来光滑噪声数据,下面哪个选项是正确的
9,9,9;22,22,22;25,25,34B
8,8,8;22,22,22;25,25,34C
9,9,9;21,21,21;25,25,34D
4,4,15;21,21,21;25,25,253
下面有关转换描述错误的是
转换是ETL解决方案中最主要的部分,主要负责处理抽取、转换、加载各阶段对数据行的各种操作B
转换中的步骤通过跳来连接,定义了一个单向通道C
转换中的跳传递的是一个结果对象D
转换中的图形化组件被称为步骤4
下面哪一项不是属于数据归约的策略
()A.维归约B.数量归约C.数据压缩D.属性构造5
下面有关步骤描述错误的是
()A.步骤需要有一个唯一的名字B.步骤之间通过跳进行数据行的单向传输C.大多数的步骤都可以有多个输出跳D.可以影子复制6
基于CDC的数据变更有两种:侵入性和非侵入性的
下面哪一项是属于非侵入性的
基于源数据的CDCB
基于日志的CDCC
基于触发器的CDCD
基于快照的CDC7
下面哪一项描述的正确
拆分字段和拆分字段成多行是一样的B
合并字段是拆分字段的逆运算C
拆分字段步骤支持正则表达式D
使用拆分字段成多行步骤,被拆分的字段将不复存在8
以下说法错误的是
主成分分析、属性子集选择为维归约方法
直方图、聚类、抽样和数据立方体聚集为数量归约方法
用于规约的时间可以超过或抵消在规约后