第十模块 概率与统计第四十八讲 随机抽样、用样本估计总体、变量间的相互关系、统计案例回归课本1
样本及抽样的定义(1) 在数理统计中称研究对象的全体为总体 , 组成总体的每一个基本单元为个体 , 从总体中抽取若干个个体 x1,x2,…,xn,这样的 n 个个体 x1,x2,…,xn称为大小为 n( 容量为 n) 的一个样本
(2) 抽样 : 抽样是为了获取总体的信息 , 特别在客观实际中对总体的全部个体逐一进行研究 , 有的是不适宜、不可能或不必要的
因此 , 抽样调查是获取总体信息的重要方法
随机抽样(1) 简单随机抽样 : 从一个总体中通过逐个抽取的方法从中抽取一个样本 , 且每次抽取时各个个体被抽到的概率相等 ,这样的抽样称为简单随机抽样
这样抽出的样本称为简单随机样本
简单随机抽样的基本方法有抽签法和随机数表法
(2) 系统抽样 : 系统抽样被称为等距抽样或机械抽样
它按照时间或空间的等距间隔抽取样本 , 即将总体分成几个部分 ,然后按照预先定出的规则 , 从每一部分抽取一个个体 , 得到所需要的样本 , 这种抽样称为系统抽样
系统抽样与简单随机抽样的联系在于 : 将总体均分后的每一部分进行抽样时 , 采用的是简单随机抽样
(3) 分层抽样 : 当总体中一部分个体与另一部分个体有明显的差异且易于区别时 , 常将相近的个体归成一组 , 然后按照各部分所占的比例进行抽样 , 这种抽样称为分层抽样
其中所分成的各部分称为层
分层抽样时 , 每一个个体被抽到的概率都是相等的
频率分布表、频率分布直方图与茎叶图(1) 频率分布样本中所有数据 ( 或者数据组 ) 的频数和样本容量的比 , 就是该数据的频率
所有数据 ( 或者数据组 ) 的频率的分布变化规律叫做频率分布 , 可以用频率分布表、频率分布直方图、频率分布折线图