品尝一勺汤,就可以知道一锅汤的味道,你知道其中蕴涵的道理吗
生活中的“数学”高质量的样本数据来自“搅拌均匀”的总体
如果我们能够设法将总体“搅拌均匀”,那么从中任意抽取一部分个体的样本,它们含有与总体基本相同的信息
阅读一个著名的案例在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性
下面的故事是一次著名的失败的统计调查,被称为抽样中的泰坦尼克事件
它可以帮助我们理解为什么一个好的样本如此重要
在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查
调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统
为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有)
通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜
实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:候选人预测结果选举结果罗斯福4362兰顿5738思考你认为预期结果出错的原因是什么
原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)
像本例中这样容易得到的样本称为方便样本
如果使用“方便样本”,那么得出与事实不符的结论的可能性就会大大增加
结论:在抽样时不能只图方便
如果只从一些容易得到的个体中抽取样本,那么所得到的样本只是一个“方便样本”,“方便样本”的代表性差,基本这种方便样本得出的结论就会与事实相左
那么,怎样从总体中抽取样本呢
如何表示样本数据
如何从样本数据中提取基本信息(样本分布、样本数字特征等),来推断总体的情况呢
这些正是本章要解决的问题
数理统计所要解决的问题是如何根据样本来推断总体
首先必须清楚地知道要收集的数据是什么;其次,我们检验样本的目的是为了了解总体的情况;再次,我们要知道