60 第 四 章 调 查 数 据 的 推 断 分析 调查数据往往是来自总体的一个随机样本,通过对样本数据的处理,可以获得样本的数据特征。然而,调查研究的目的是要揭示总体的数量特征和变化规律,所以,就存在一个如何用样本信息去推断总体数量特征的问题。调查数据的推断分析是调查数据分析中的一项经常性内容,也是一项十分重要的数据分析工作。本章主要介绍调查数据推断分析的基本方法,内容包括参数估计、假设检验和方差分析。 第一节 参数估计 一、参数估计的一般问题 (一)统计量与参数 所谓参数估计,就是用样本统计量推算总体分布中的参数。参数是描述总体特征的概括性数字度量。因总体是确定的且通常未知,所以参数通常也是未知的,是一个需要估计的常数。推断问题中人们所关心的参数通常有:均值( )、方差(2 )、成数(P)。统计量是根据样本数据计算出的概括性数字度量,是样本的函数,它反映着样本的信息;样本的随机性决定统计量是随机变量。与所需要认识的参数相对应,推断问题中,最常用的统计量有: 样本均值:11niiXxn (用来估计总体均值 ) 样本成数: pˆ (用来估计总体成数P ) 样本方差:2211()1nixiSxxn 或2(1)PSpp (用来估计总体方 61 差2) 估计问题中,统计量又称为估计量。 (二)统计量的抽样分布 统计量是一个随机变量,称它的概率分布为抽样分布。由于概率分布能很好地描述一个随机变量的性质,故用抽样分布来描述统计量的性质。知道概率分布,便可计算任一随机事件发生的概率;反映在估计问题中,知道抽样分布,意味着不仅可以计算估计误差这一随机事件发生的概率,而且可以控制估计误差。所以,抽样分布理论是统计推断的基础,是学习的重点。 考虑到实际问题中,因客观条件的不同或研究目的的不同,在一些情况下,我们只可能获得较少的数据,即样本容量n 不可能很大,当n <30 时,这类问题称为小样本问题;在另一些情况下,却可以进行大量重复试验,从而取得容量很大的样本,当n ≥30 时,这类问题称为大样本问题。对大样本问题,由中心极限定理很容易确定出统计量的抽样分布。但对小样本问题,则要在正态分布总体的前提条件下,用统计量的精确分布来进行推断。 常用的抽样分布有:样本均值的抽样分布,样本方差的抽样分布和样本成数的抽样分布。 1.样本均值的抽样分布 (1)一个正态总体。设总体 X 的均值为 ,方差为2...