如何减少非抽样误差如何减少非抽样误差一,非抽样误差的定义:市场调查活动必不可少地会产生误差,如何减少误差,提高精度这是委托方和市场咨询公司最关注的焦点之一。要减少误差,首先要了解误差来自于哪里?如何对各种误差进行分类?不同类别的误差有什么样的方法可以预防?如果误差已经发生了,采用什么样的方法可以弥补?b5E2RGbCAP按最简单的分类方法,误差可以分为两类,一类是抽样误差,另一类是非抽样误差。所谓的抽样误差是由抽样的随机性引起的,一般意义上来说是无法减少的。而非抽样误差是指除抽样误差以外所有的误差的总和。引起非抽样误差的原因很多,比如抽样框不齐全,访问员工作经验有限,被访者不配合访问而加以虚假的回答,问卷设计本身存在缺陷等等。应该说非抽样误差的产生贯穿了市场调查的每一个环节,任何一个环节出错都有可能导致非抽样误差增加而使数据失真。我们平时说的控制误差主要指的就是控制非抽样误差。p1EanqFDPw对于非抽样误差的定义和分类也是到了近代才逐渐清晰和明确起来,最初,鲍德威在1915年提出所谓的误差有四个来源分别是:DXDiTa9E3d?获得的信息不正确或不真实?定义和标准不严格、不确切、不适当?样本不能代表总体?部分数据对于总体的估计将要产生的误差在鲍德威的四个误差来源中,前两个都是非抽样误差。鲍德威对于各种误差提出了比较简略的分类方法,而戴明在他的基础上对非抽样误差进行了比较全面和系统的分类。戴明认为误差除了抽样误差以外一般应该包括以下部分:RTCrpUDGiT?回答的变异性?不同类型和不同水平的访问员?访问员引起的主观偏差?委托方对于数据的期望(人为影响)?问卷设计的缺陷?抽样前后总体发生的变化?无回答的偏差?过时记录的偏差?数据缺乏代表性?解释数据的误差在戴明以后,西方又有许多关于非抽样误差的论文出现,对非抽样误差的成因和分类进行了比较完整的阐述。一般而言,非抽样误差可以分为三类,分别是:抽样框误差、无回答误差和计量误差。5PCzVD7HxA二,抽样框误差:所谓的抽样框误差指目标总体和抽样总体不一致时产生的误差。理想的抽样框需要满足以下要求,就是所有的抽样单位必须覆盖目标总体,对于较为简单的单阶段抽样,抽样框要求每个目标总体单位都应该对应着一个抽样单位,抽样单位必须相互独立,互不重叠,并且唯一地与目标总体相连接。如果目标总体与抽样总体不一致时就产生了抽样框误差。抽样框误差在简单抽样框和复杂抽样框中都会出现。所谓的简单抽样框主要适用于简单随机抽样,就是抽样框没有任何辅助信息,只是对样框内的数据按原样随机排列。复杂抽样框指抽样框附加了一些辅助信息。这些信息将使抽样更符合总体的特征值。举一个简单的例子,比如要抽查上海市所有零售企业的销售状况,假如事先知道上海市零售企业规模的分布情况,就可以根据这个分布比例采用分层抽样的方法。如jLBHrnAILg果分布比例是正确的,那么分层抽样的精度要高于简单随机抽样,而如果比例不正确,那么误差更大。这里的分布比例就是所谓的辅助信息。xHAQX74J0X抽样框误差有五个来源,分别是:?不能覆盖目标总体单位所谓的不能覆盖目标总体单位,指的是目标总体单位没有出现在抽样样本中,那么他们就不可能在随后的抽样过程中被选中,导致数据丢失。LDAYtRyKfE?与不能覆盖相对应的就是,抽样样本包含了非目标总体单位包含非目标总体单位主要是由于目标总体的变化产生的误差。相对于不能覆盖的误差而言,包含非目标总体单位误差比较容易被发现。Zzz6ZB2Ltk?复合联接复合联接的意思就是一个目标总体单位联接着一个以上的抽样单位。比如,有的家庭拥有两个住所、两个地址,那么他们被选中的概率就是一般家庭的两倍。复合联接的对象如果具有某些特征值就会使样本失真,导致均值发生偏差。dvzfvkwMI1?抽样框老化统计数据有很强的即时性,随着时间的推移,抽样框必须更新,否则就会老化不符合实际情况使抽样不精确。最典型的例子,就是随着城市建设的大规模展开,许多地区已经被改造,地址发生了完全的变化,如果依旧按以前的抽样框去抽样,那么精度就会非常难以控制。rqyn14ZNXI?辅助信息不正确前面四种抽样框误差会发生在简单抽样框也...