第一章下列属于数据挖掘任务的是()根据性别划分公司的顾客计算公司的总销售额预测一对骰子的结果利用历史记录预测公司的未来股价可以在不同维度合并数据,从而形成数据立方体的是()数据库数据源数据仓库数据库系统目的是缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果的是()数据清洗数据集成数据变换数据归约下述四种方法哪一种不是常见的分类方法()决策树支持向量K-Means(聚类)朴素贝叶斯分类下列任务中,属于数据挖掘技术在商务智能方面应用的是()欺诈检测垃圾邮件识别根据因特网的搜索引擎查找特定的Web页面定向营销异常检测的应用包括()网络攻击预测某股票的未来价格计算公司的总销售额根据性别划分公司顾客将原始数据进行集成、变换、维度规约、数值规约是哪个步骤的任务()频繁模式挖掘分类和预测数据预处理数据流挖掘KDD是(数据挖掘与知识发现下列有关离群点的分析错误的是()一般情况下离群点会被当作噪声而丢弃离群点即是噪声数据在某些特殊应用中离群点有特殊的意义信用卡在不常消费地区突然消费大量金额的现象属于离群点分析范畴下列关于模式识别的相关说法中错误的是()模式识别的本质是抽象出不同事物中的模式并由此对事物进行分类医疗诊断属于模式识别的研究内容之一手机的指纹解锁技术不属于模式识别的应用自然语言理解也包含模式识别问题()不属于数据挖掘的应用领域。商务智能信息识别搜索引擎医疗诊断目前数据分析和数据挖掘面临的挑战性问题不包括()数据类型的多样化高维度数据离群点数据分析与挖掘结果可视化常见的机器学习方法有监督学习、无监督学习、半监督学习数据挖掘是从大规模的数据中抽取或挖掘出感兴趣的知识或模式的过程或方法。频繁模式是指数据集中频繁出现的模式离群点是指全局或者局部范围内偏离一般水平的观测对象联机分析处理是数据仓库的主要应用分类是指通过建立模型预测离散标签,回归是通过建立连续值模型推断新的数据的某个数值型属性。数据库是面向事务,数据仓库是面向主题数据挖掘主要侧重解决的四类问题:分类、聚类、关联、预测数据分析是指采用适当的统计分析方法对收集到的数据进行分析、概括和总结。特征化是一个目标类数据的一般特性或特性的汇总。无监督学习可以在没有标记的数据集上进行学习。对聚类就是把一些对象划分为多个组或者聚簇,从而使同组内对象间比较相似而不同组对象间差异较大。对事务数据库的每个记录代表一个事务。对数据仓库和数据库其实是相同的,都是数据或信息的存储系统。错区分是将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较。对离群点因偏离一般水平而不需要考虑和研究。错聚类过程的输入对象有与之关联的目标信息。错数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。对数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。对数据仓库一般存储在线交易数据,数据库存储的一般是历史数据。错数据分析是指采用适当的统计分析方法对收集到的数据进行分析、概括和总结,对数据进行恰当的描述,并提取出有用的信息的过程。对数据分析的定义:数据分析就是对数据进行分析。专业的说法,数据分析是指根据分析目的,用适当的统计分析方法及工具,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用。对数据库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。错(说的是数据仓库)第二章下面哪个不属于数据的属性类型()标称序数区间相异3属于定量的属性类型是()标称序数区间相异一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是()一年级二年级三年级四年级假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为()0.8211.2241.4580.716考虑数据集{12243324556826},其四分位数极差是()3124553光年所属的属性类型为()标称属性序数属性...