南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2一、单选题共20题,40分1、()用替代的、较小的数据表示形式替换原数据
A维归约B数量归约C离散D聚集【南开】答案是:B2、只有非零值才重要的二元属性被称作()
A计数属性B离散属性C非对称的二元属性D对称属性【南开】答案是:C3、职位可以按顺序枚举,对于教师有:助教、讲师、副教授、教授
职位属性是()
A标称属性B序数属性C数值属性D二元属性【南开】答案是:B4、()去掉数据中的噪声,这类技术包括分箱、回归和聚类
A光滑B聚集C规范化D属性构造【南开】答案是:A5、在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为()
A基于类的排序方案B基于规则的排序方案C基于度量的排序方案D基于规格的排序方案【南开】答案是:B6、分位数是取自数据分布的每隔一定间隔上的点,把数据划分成基本上大小相等的连贯集合
如:4-分位数是()个数据点,它们把数据分布划分成4个相等的部分,使得每部分表示数据分布的四分之一
A1B2C3D4【南开】答案是:C7、决策树学习:决策树算法对数据处理过程中,将数据按()结构分成若干分枝形成决策树,从根到树叶的每条路径创建一个规则
A树状B网状C星形D雪花形【南开】答案是:A8、以下属于可伸缩聚类算法的是()
ACUREBDENCLUECCLIQUEDOPOSSUM【南开】答案是:A9、()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术
AMIN(单链)BMAX(全链)C组平均DWard方法【南开】答案是:C10、如果规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则为()
A无序规则B穷举规则C互斥规则D有序规则【南开】答案是:C11、()是KDD
A数据挖掘与