SPSS18数据分析基础与实践第三章数据预处理VIP免费

下载本文档

阅读 128
下载 13
格式 pdf
大小 3.54 MB
约41页
2024-12-05 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/41页

2/41页

3/41页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/41

文本预览下载提示常见问题

第3 章数据预处理本章学习目标：  掌握SPSS 数据预处理的可视离散化方法；  了解SPSS 缺失值的填补方法；  掌握SPSS 的数据校验方法；  如何标识重复个案；  如何标识异常个案；  学习如何从数据集中选择符合条件的个案。随着计算机系统能力的提高，对信息的需要成比例增长，导致收集的数据越来越多。随之而来的问题是出现更多的个案、更多的变量以及更多的数据输入错误。这些错误会损害作为数据仓储最终目标的预测模型的预测能力，因此必须使数据保持“干净”。不过，数据仓储中数据量的增长已经大大超出了手动验证个案的能力，因而实现自动化的数据验证过程变得十分关键。数据预处理即当录入或读取数据后，对数据进行必要的清理（包括查错纠错、标识数据中的异常个案和无效个案、变量和数据值等）、转换、填补缺失值等，为后续统计分析应用（如均值比较、方差分析、回归分析等）打下良好基础。如果把整个统计分析过程比作大厨烧菜，那么种菜或去菜场买菜等获取食材就相当于录入或读取数据，而扔掉坏的菜叶、切菜等准备工作就相当于数据预处理，而在锅里烧菜烹饪就相当于后续具体统计分析应用（如均值比较、方差分析、相关性分析、回归分析等）。可见，数据预处理虽不产生最终的分析结果，但作为最终分析的准备，是数据分析必不可少的一环，它在完整的数据分析项目过程中的位置如图 3-1 所示。在本章中，3.1 节讨论尺度数据（即连续型数据）转换到分类数据的可视离散化方法；3.2 节讨论 SPSS 中数据缺失值的填补方法；3.3 节讨论 SPSS 中数据校验的方法；3.4 节学习如何标识重复个案和异常个案；3.5 节学习如何从数据集中选择满足第3章 70 SPSS 18数据分析基础与实践条件的个案。图3-1 统计分析项目过程图 3.1 可视离散化可视离散化（可视化分段）（Visual Binning）用于为定量变量（或尺度变量）创建分类变量（或定性变量），从而实现连续变量的离散化。在统计分析中，有时候需要了解总体的大致分布状况，而不需要了解属性的具体信息。例如，调查居民的收入水平，实际得到的是以“元”计数的具体收入值。有时候用户最关心的是处于贫困线以下（假设年收入￥2 000 以下为贫困）的居民、中等收入（年收入为￥2 000-￥30 000）的居民和高收入（年收入高于￥30 000）的居民各占多大比例。这时候，可以对定量变量年收入进行“可视离散化”，创建一个包括处于贫困线以下、中等收入...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

SPSS18数据分析基础与实践第三章数据预处理

第3 章数据预处理本章学习目标：  掌握SPSS 数据预处理的可视离散化方法；  了解SPSS 缺失值的填补方法；  掌握SPSS 的数据校验方法；  如何标识重复个案；  如何标识异常个案；  学习如何从数据集中选择符合条件的个案

随着计算机系统能力的提高，对信息的需要成比例增长，导致收集的数据越来越多

随之而来的问题是出现更多的个案、更多的变量以及更多的数据输入错误

这些错误会损害作为数据仓储最终目标的预测模型的预测能力，因此必须使数据保持“干净”

不过，数据仓储中数据量的增长已经大大超出了手动验证个案的能力，因而实现自动化的数据验证过程变得十分关键

数据预处理即当录入或读取数据后，对数据进行必要的清理（包括查错纠错、标识数据中的异常个案和无效个案、变量和数据值等）、转换、填补缺失值等，为后续统计分析应用（如均值比较、方差分析、回归分析等）打下良好基础

如果把整个统计分析过程比作大厨烧菜，那么种菜或去菜场买菜等获取食材就相当于录入或读取数据，而扔掉坏的菜叶、切菜等准备工作就相当于数据预处理，而在锅里烧菜烹饪就相当于后续具体统计分析应用（如均值比较、方差分析、相关性分析、回归分析等）

可见，数据预处理虽不产生最终的分析结果，但作为最终分析的准备，是数据分析必不可少的一环，它在完整的数据分析项目过程中的位置如图 3-1 所示

在本章中，3

1 节讨论尺度数据（即连续型数据）转换到分类数据的可视离散化方法；3

2 节讨论 SPSS 中数据缺失值的填补方法；3

3 节讨论 SPSS 中数据校验的方法；3

4 节学习如何标识重复个案和异常个案；3

5 节学习如何从数据集中选择满足第3章 70 SPSS 18数据分析基础与实践条件的个案

图3-1 统计分析项目过程图 3

1 可视离散化可视离散化（可视化分段）（Visual Binning）用于为定量变量

小辰 + 关注: 实名认证
内容提供者

出售各种文档和资料

收藏店铺进入空间

SPSS18数据分析基础与实践第三章数据预处理VIP免费

SPSS18数据分析基础与实践第三章数据预处理

您可能关注的文档

相关文档

热门下载

相关标签