1《数据挖掘》在线作业()很费时,并且当数据集很大、缺失很多值时,该方法可能行不通。A:人工填写缺失值方法B:全局常量填充C:自动填充D:删除参考选项:A数据仓库和OLAP工具基于多维数据模型。该模型将数据看作()形式。A:数据立方体(datacube)B:整数C:离散D:不同参考选项:ADBSCAN在最坏情况下的时间复杂度是()。A:O(m)B:O(m2)C:O(logm)D:O(m*logm)参考选项:B()可以用来把数据变换到多个粒度层。例如,关于销售的数据挖掘模式除了在单个分店挖掘之外,还可以针对指定的地区或国家挖掘。A:概念分层B:聚类C:数据变换D:数据归约参考选项:A以下属于可伸缩聚类算法的是()。A:CUREB:DENCLUEC:CLIQUED:OPOSSUM参考选项:A只有非零值才重要的二元属性被称作()。A:计数属性B:离散属性C:非对称的二元属性D:对称属性2参考选项:C()用替代的、较小的数据表示形式替换原数据。A:维归约B:数量归约C:离散D:聚集参考选项:B下列()不是将主观信息加入到模式发现任务中的方法。A:与同一时期其他数据对比B:可视化C:基于模板的方法D:主观兴趣度量参考选项:A()是KDD。A:数据挖掘与知识发现B:领域知识发现C:文档知识发现D:动态知识发现参考选项:A()通常以可变长度的字节串存储,并且为便于数据的引用,数据片段要相互链接或建立多维方式的索引。A:文本数据B:多媒体数据C:时间数据D:空间数据参考选项:B设X={1,2,3}是频繁项集,则可由X产生()个关联规则。A:4B:5C:6D:7参考选项:C假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为()。A:18.33B:22.6C:26.8D:27.9参考选项:A有关数据仓库的开发特点,不正确的描述是()。A:数据仓库开发要从数据出发B:数据仓库使用的需求在开发出去就要明确C:数据仓库的开发是一个不断循环的过程,是启发式的开发D:在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式参考选项:A决策树中不包含以下哪种结点?()A:根结点(rootnode)B:内部结点(internalnode)C:外部结点(externalnode)D:叶结点(leafnode)参考选项:C考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为()。A:0.75B:0.35C:0.468D:0.574参考选项:C()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术。A:MIN(单链)B:MAX(全链)C:组平均D:Ward方法参考选项:C以下关于人工神经网络(ANN)的描述错误的有()。A:神经网络对训练数据中的噪声非常鲁棒B:可以处理冗余特征C:训练ANN是一个很耗时的过程D:至少含有一个隐藏层的多层神经网络参考选项:A4聚类技术把()看做对象。A:数据B:数据库C:簇D:数据元组参考选项:D()是一种不使用目标变量(至少不明确使用)的数据挖掘。A:无指导数据挖掘B:有指导数据挖掘C:聚类D:数据分析参考选项:A标称变量是二元变量的推广,它可以具有()的状态值。例如,map_color是一个标称变量,它可能有5个状态:红色,黄色,绿色,粉红色和蓝色。A:两个B:多于两个C:一个D:三个参考选项:B离群点的类型包括:()。A:全局离群点B:情境离群点C:集体离群点D:单独离群点参考选项:A,B,C,D以下哪些学科和数据挖掘有密切联系()?A:统计B:计算机组成原理C:矿产挖掘D:人工智能参考选项:A,D层次聚类方法包括()。A:划分聚类方法B:凝聚型层次聚类方法C:分解型层次聚类方法D:基于密度聚类方法参考选项:B,C5非频繁模式()。A:其支持度小于阈值B:都是不让人感兴趣的C:包含负模式和负相关模式D:对异常数据项敏感参考选项:A,D()都导致不正确的数据。A:缺失值B:噪声C:不一致性D:分层参考选项:A,B,C数据仓库在技术上的工作过程是:()。A:数据的抽取B:存储和管理C:数据的表现D:数据仓库设计参考选项:A,B,C,D在图象和视频数据库中可以挖掘涉及多媒体对象的关联规则,至少包含以下三类规则:()。A:与时间关系...