不等概率抽样 引例: O’Brien et al. (1995) 对 Philadelphia地区的病人进行抽样, 目的是了解病人对于医疗服务的偏好。目标总体是这一区域的所有注册的医院的病人。总共有 294家医院,27652个床位(抽样以前,研究人员只知道床位数,不知道病人数)。 等概率的抽取样本医院的缺点? 首先,可能医院中愿意接受 CPR治疗的病人数量会正比与医院床位的数量,采用等概率简单估计量可能会有大的方差。 其次,自加权的等概率样本可能难于管理。可能仅仅为了调查一两个病人就需要去一家医院,并且合理分配调查人员的工作负担也是比较困难的。 第三,调查成本在调查开始的时候是未知的,一个 40个医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本。 其他办法? 1、调查人员还可以采用与医院病床数量成比例的方法抽取 57个医院,然后从每个样本医院中抽取 30个简单随机样本床位。 2、如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率? 3、而且成本在调查实施前是已知的,因为每个访员在每个医院访问的病人数量是相同的。而且,总体总量的方差可能更小。 4、分层抽样:抽样选 择 概率小的单位会有较高 的权数。 5、采用不等概率抽样来 减 少 抽样方差而不采用清 晰 的分层。采用不同的概率来选 择 初 级 样本单元 ,并且在估计中采用不同的权数来 进行弥 补 。 抽样的关 键 是每个样本的选 择 概率是已知的。 iP) =在第一次抽取中被 抽中单元 i( iP被 选 入样 本 ) =单元 i( 一、不等概率抽样适 用情 况 第一,抽样单元 在总体中所占 的地位不一致。第二 ,调查的总体单元 与抽样总体的单元 不一致。第三,改 善 估计量。不等概率抽样的优 点主要是大大提 高 了估计精 度 ,减 少 抽样误 差,但 使 用它 也由 条 件 ,就是必 须 要有说 明 每个单元 规 模大小的辅 助 变 量来 确 定 每个单元 入样的概率,这在抽样设 计及 估计时都 是必 须得 。 二 、不等概率抽样的分类 1、放 回 不等概率抽样 每次在总体中对每个单元 按 入样概率进行抽样,抽取出 来 的样本单元 放 回 总体,然后进行下 一次抽样,这样,每次抽样过 程 都 是从同一个总体独 立 进行的,这种 不等概率抽样称 为( 有) 放 回 不等概率抽样。由 于是放 回 的,因此 某 个单元可能...