数据挖掘离线作业VIP免费

下载本文档

阅读 138
下载 23
格式 pdf
大小 427.92 KB
约9页
2024-11-25 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/9页

2/9页

3/9页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

浙江大学远程教育学院《数据挖掘》课程作业姓名：吴金翔学号： 713070244001 年级： 1 3 春信息管理学习中心：余杭 ————————————————————————————— 第一章引言一、填空题（1）数据库中的知识挖掘(KDD)包括以下七个步骤：数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估和知识表示（2）数据挖掘的性能问题主要包括：算法的效率、可扩展性和并行处理（3）当前的数据挖掘研究中，最主要的三个研究方向是：统计学、数据路技术和机器学习（4）孤立点是指：一些与数据的一般行为或模型不一致的孤立数据二、简答题（1）什么是数据挖掘？答：数据挖掘指的是从大量的数据中挖掘出那些令人感兴趣的，有用的，隐含的，先前未知的和可能有用的模式或知识。（2）一个典型的数据挖掘系统应该包括哪些组成部分？答：1，数据库、数据仓库或其他信息库；2，数据库或数据仓库服务器；3，知识库；4，数据挖掘引擎；5，模式评估模块；6.图形用户界面。（3）Web 挖掘包括哪些步骤？答：数据清理（可能有占全过程的 60%的工作量）；将数据存入数据仓库；建立数据立方体；选择用来进行数据挖掘的数据；数据挖掘（选择适当的算法来找到感兴趣的模式）；展现挖掘结果；将模式或者知识应用或者存入知识库。（4）请列举数据挖掘应用常见的数据源。（或者说，我们都在什么样的数据上进行数据挖掘）答：常见的数据源包括关系数据路、数据仓库、事务数据库和高举数据库系统和信息库。其中国际数据库系统和信息库包括：空间数据库、时间数据库和时间序列数据库、流数据、多媒体数据库、面向对象数据库和对象关系数据库、异种数据库和遗产数据库、文本数据库和万维网等。第二章认识数据一、填空题（1）两个文档向量 d 1 和 d 2 的值为：d 1 = (1, 0, 3, 0, 2)，d 2 = (3, 2, 0, 0, 1)，则它们的余弦相似度为： 5/13 （2）数据离散度的常用度量包括极差、分位数、四分位数、百分位数四分位数极差和标准差（3）一种常用的确定离群点的简单方法是：出落在至少高于第三个四分位数或低于第一个四分位数1.5*IQR 处的值。二、单选题（1）对于下图所示的正倾斜数据，中位数、平均值、众数三者之间的关系是： A、中位数=平均值=众数； B 中位数>平均值>众数； C、...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

数据挖掘离线作业

答：数据挖掘指的是从大量的数据中挖掘出那些令人感兴趣的，有用的，隐含的，先前未知的和可能有用的模式或知识

（2）一个典型的数据挖掘系统应该包括哪些组成部分

答：1，数据库、数据仓库或其他信息库；2，数据库或数据仓库服务器；3，知识库；4，数据挖掘引擎；5，模式评估模块；6

图形用户界面

（3）Web 挖掘包括哪些步骤

答：数据清理（可能有占全过程的 60%的工作量）；将数据存入数据仓库；建立数据立方体；选择用来进行数据挖掘的数据；数据挖掘（选择适当的算法来找到感兴趣的模式）；展现挖掘结果；将模式或者知识应用或者存入知识库

（4）请列举数据挖掘应用常见的数据源

（或者说，我们都在什么样的数据上进行数据挖掘）答：常见的数据源包括关系数据路、数据仓库、事务数据库和高举数据库系统和信息库

其中国际数据库系统和信息库包括：空间数据库、时间数据库和时间序列数据库、流数据、多媒体数据库、面向对象数据库和对象关系数据库、异种数据库和遗产数据库、文本数据库和万维网等

第二章认识数据一、填空题（1）两个文档向量 d 1 和 d 2 的值为

小辰2 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

数据挖掘离线作业VIP免费

数据挖掘离线作业

您可能关注的文档

相关文档

热门下载

相关标签