第9章数据处理1第一页,共三十五页
开篇案例家庭外出就餐的有关数据类≤l00100—300300—500500—1000≥1000合计频数41224882260768•在某城市调查居民当月在外就餐的费用,向1000户家庭发放了调查问卷,回收了768份问卷
统计结果如上表所示
•不响应的户有232户
在响应的768户中,高档住宅户仅占1.6%,而不响应的232户中,高档住宅户占到38%
那么,我们应当如何看待这些数据
如何使用这些数据对总体进行推断呢
2第二页,共三十五页
9.1数据处理及其一般程序•广义上讲,数据处理是指在对数据资料进行统计分析之前要做的所有准备工作
•在资料量化和分析计算机化的背景下,狭义的数据处理,是指把调查中收集到的数据转换为适合汇总制表和数据分析形式的过程
主要包括–检查资料中潜存的错误–将数据资料转化为数字形式–录入数据–对不完整的数据进行插补–将数据资料变成计算机数据文件•数据处理对数据质量和成本有很大影响
3第三页,共三十五页
数据处理的一般程序•以纸制问卷为例,数据处理的过程(如图9-1)
初步审核及净化初步审核及净化数据编码数据编码数据录入数据录入详细审核与插补详细审核与插补离群值的检测处理离群值的检测处理数据存储数据存储图9-1数据处理的一般程序4第四页,共三十五页
数据处理的程序•1.初步审核及净化–审核问卷填写的完整性和数据质量,目的是确定哪些问卷可以接受,哪些问卷要被剔出
–问卷审核规则:下述情况的问卷一般不能接受:•所回收的问卷明显不完整,如缺页或多页;•问卷从整体上是回答不完全的;•问卷的几个部分是回答不完全的;•回答表明被访者没弄清问题含义或没阅读填答说明;•被访者的回答表现出某种系统偏差,如总选择中性答案;•问卷是由不合要求的被访者回答的
–将原始问卷区分为可以接受、明显要作废、对是否可以接受有疑问三部分,是有益的