南开大学《数据挖掘》在线作业5 VIP免费

下载本文档

阅读 148
下载 16
格式 pdf
大小 285.98 KB
约8页
2024-11-11 发布于山东
收藏
评论
点赞(0)
海报
举报

1/8页

2/8页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

1《数据挖掘》在线作业()很费时,并且当数据集很大、缺失很多值时,该方法可能行不通。A:人工填写缺失值方法B:全局常量填充C:自动填充D:删除参考选项：A数据仓库和OLAP工具基于多维数据模型。该模型将数据看作()形式。A:数据立方体(datacube)B:整数C:离散D:不同参考选项：ADBSCAN在最坏情况下的时间复杂度是()。A:O(m)B:O(m2)C:O(logm)D:O(m*logm)参考选项：B()可以用来把数据变换到多个粒度层。例如,关于销售的数据挖掘模式除了在单个分店挖掘之外,还可以针对指定的地区或国家挖掘。A:概念分层B:聚类C:数据变换D:数据归约参考选项：A以下属于可伸缩聚类算法的是()。A:CUREB:DENCLUEC:CLIQUED:OPOSSUM参考选项：A只有非零值才重要的二元属性被称作()。A:计数属性B:离散属性C:非对称的二元属性D:对称属性2参考选项：C()用替代的、较小的数据表示形式替换原数据。A:维归约B:数量归约C:离散D:聚集参考选项：B下列()不是将主观信息加入到模式发现任务中的方法。A:与同一时期其他数据对比B:可视化C:基于模板的方法D:主观兴趣度量参考选项：A()是KDD。A:数据挖掘与知识发现B:领域知识发现C:文档知识发现D:动态知识发现参考选项：A()通常以可变长度的字节串存储,并且为便于数据的引用,数据片段要相互链接或建立多维方式的索引。A:文本数据B:多媒体数据C:时间数据D:空间数据参考选项：B设X={1,2,3}是频繁项集,则可由X产生()个关联规则。A:4B:5C:6D:7参考选项：C假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为()。A:18.33B:22.6C:26.8D:27.9参考选项：A有关数据仓库的开发特点,不正确的描述是()。A:数据仓库开发要从数据出发B:数据仓库使用的需求在开发出去就要明确C:数据仓库的开发是一个不断循环的过程,是启发式的开发D:在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式参考选项：A决策树中不包含以下哪种结点?()A:根结点（rootnode)B:内部结点（internalnode）C:外部结点（externalnode）D:叶结点（leafnode）参考选项：C考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为()。A:0.75B:0.35C:0.468D:0.574参考选项：C()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术。A:MIN（单链）B:MAX（全链）C:组平均D:Ward方法参考选项：C以下关于人工神经网络(ANN)的描述错误的有()。A:神经网络对训练数据中的噪声非常鲁棒B:可以处理冗余特征C:训练ANN是一个很耗时的过程D:至少含有一个隐藏层的多层神经网络参考选项：A4聚类技术把()看做对象。A:数据B:数据库C:簇D:数据元组参考选项：D()是一种不使用目标变量(至少不明确使用)的数据挖掘。A:无指导数据挖掘B:有指导数据挖掘C:聚类D:数据分析参考选项：A标称变量是二元变量的推广,它可以具有()的状态值。例如,map_color是一个标称变量,它可能有5个状态:红色,黄色,绿色,粉红色和蓝色。A:两个B:多于两个C:一个D:三个参考选项：B离群点的类型包括:()。A:全局离群点B:情境离群点C:集体离群点D:单独离群点参考选项：A,B,C,D以下哪些学科和数据挖掘有密切联系()?A:统计B:计算机组成原理C:矿产挖掘D:人工智能参考选项：A,D层次聚类方法包括()。A:划分聚类方法B:凝聚型层次聚类方法C:分解型层次聚类方法D:基于密度聚类方法参考选项：B,C5非频繁模式()。A:其支持度小于阈值B:都是不让人感兴趣的C:包含负模式和负相关模式D:对异常数据项敏感参考选项：A,D()都导致不正确的数据。A:缺失值B:噪声C:不一致性D:分层参考选项：A,B,C数据仓库在技术上的工作过程是:()。A:数据的抽取B:存储和管理C:数据的表现D:数据仓库设计参考选项：A,B,C,D在图象和视频数据库中可以挖掘涉及多媒体对象的关联规则,至少包含以下三类规则:()。A:与时间关系...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

南开大学《数据挖掘》在线作业5

1《数据挖掘》在线作业()很费时,并且当数据集很大、缺失很多值时,该方法可能行不通

A:人工填写缺失值方法B:全局常量填充C:自动填充D:删除参考选项：A数据仓库和OLAP工具基于多维数据模型

该模型将数据看作()形式

A:数据立方体(datacube)B:整数C:离散D:不同参考选项：ADBSCAN在最坏情况下的时间复杂度是()

A:O(m)B:O(m2)C:O(logm)D:O(m*logm)参考选项：B()可以用来把数据变换到多个粒度层

例如,关于销售的数据挖掘模式除了在单个分店挖掘之外,还可以针对指定的地区或国家挖掘

A:概念分层B:聚类C:数据变换D:数据归约参考选项：A以下属于可伸缩聚类算法的是()

A:CUREB:DENCLUEC:CLIQUED:OPOSSUM参考选项：A只有非零值才重要的二元属性被称作()

A:计数属性B:离散属性C:非对称的二元属性D:对称属性2参考选项：C()用替代的、较小的数据表示形式替换原数据

A:维归约B:数量归约C:离散D:聚集参考选项：B下列()不是将主观信息加入到模式发现任务中的方法

A:与同一时期其他数据对比B:可视化C:基于模板的方法D:主观兴趣度量参考选项：A()是KDD

A:数据挖掘与知识发现B:领域知识发现C:文档知识发现D:动态知识发现参考选项：A()通常以可变长度的字节串存储,并且为便于数据的引用,数据片段要相互链接或建立多维方式的索引

A:文本数据B:多媒体数据C:时间数据D:空间数据参考选项：B设X={1,2,3}是频繁项集,则可由X产生()个关联规则

A:4B:5C:6D:7参考选项：C假定用于分析的数据包含属性age

数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:

您可能关注的文档

雪雪文库 + 关注: 实名认证
内容提供者

各类文档，专业文档

收藏店铺进入空间

南开大学《数据挖掘》在线作业5 VIP免费

南开大学《数据挖掘》在线作业5

您可能关注的文档

相关文档

热门下载

相关标签