扇贝抽样案例——统计方法的误区ArnoldBennett是美国MIT斯隆商学院的一名教授,在杂志Interfaces(1995年3月)中描述了最近他作为统计学“专家”提供相关服务的一个法律案例
这个案例涉及一艘远离新英格兰海岸捕捞扇贝的渔船
为了保护幼扇贝免遭捕捞,美国渔业和野生动物保护机构规定“每个扇贝肉的重量至少1/36磅才可以捕捞”
这艘船被指控违反了这个重量标准
Bennett教授在文章中描述:这艘船抵达马萨诸塞州的一个港口时装有11000袋扇贝,港务人员随机抽选了其中的18袋来检查
港务人员从每一个袋中随机取出一满勺扇贝,然后算出每个扇贝肉的平均重量
港务人员根据18袋的结果估计这艘船的每个扇贝肉的平均重量为1/39磅,低于标准,于是立即没收了捕获的95%,后来进行了拍卖
船主不服,对联邦政府提起诉讼,认为自己的捕捞符合标准,认为只选了18袋,不足以代表全体
律师问Bennett教授的问题之一就是:“能够从一个容量18的样本中得到所有扇贝的平均重量的可靠估计吗
”于是Bennett教授进行了分析:Bennett教授把被抽样的18袋的每袋的平均重量按照1/36磅为1的情况作了比较,0
93就是比1/36磅轻,1
14就代表比1/36磅重,数量低于1的表明是不符合标准的
请看下面的数据,只有两袋超过了1/36磅,其他都没有到“1”,都不符合标准
93那么正如律师所问,从11000袋中只抽出18袋作为样本合不合理呢
结论是不合理:仅用18袋作样本太小了,至少应该在30以上,才能作为推断的基本证据,否则误差很大
当然抽样中也并不是越大越好,只要样本的抽样方法是科学的,适当的样本便是好的
现在我把数据还原:0