不等概率抽样 引例: O’Brien et al
(1995) 对 Philadelphia地区的病人进行抽样, 目的是了解病人对于医疗服务的偏好
目标总体是这一区域的所有注册的医院的病人
总共有 294家医院,27652个床位(抽样以前,研究人员只知道床位数,不知道病人数)
等概率的抽取样本医院的缺点
首先,可能医院中愿意接受 CPR治疗的病人数量会正比与医院床位的数量,采用等概率简单估计量可能会有大的方差
其次,自加权的等概率样本可能难于管理
可能仅仅为了调查一两个病人就需要去一家医院,并且合理分配调查人员的工作负担也是比较困难的
第三,调查成本在调查开始的时候是未知的,一个 40个医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本
1、调查人员还可以采用与医院病床数量成比例的方法抽取 57个医院,然后从每个样本医院中抽取 30个简单随机样本床位
2、如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率
3、而且成本在调查实施前是已知的,因为每个访员在每个医院访问的病人数量是相同的
而且,总体总量的方差可能更小
4、分层抽样:抽样选 择 概率小的单位会有较高 的权数
5、采用不等概率抽样来 减 少 抽样方差而不采用清 晰 的分层
采用不同的概率来选 择 初 级 样本单元 ,并且在估计中采用不同的权数来 进行弥 补
抽样的关 键 是每个样本的选 择 概率是已知的
iP) =在第一次抽取中被 抽中单元 i( iP被 选 入样 本 ) =单元 i( 一、不等概率抽样适 用情 况 第一,抽样单元 在总体中所占 的地位不一致
第二 ,调查的总体单元 与抽样总体的单元 不一致
第三,改 善 估计量
不等概率抽样的优 点主要是大大提 高 了估计精 度 ,减 少 抽样误 差,但 使 用它