知识梳理典例变式基础训练能力提升第20讲抽样方法与总体分布的估计知识梳理典例变式基础训练能力提升知识梳理1.随机抽样(1)简单随机抽样①定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.②常用方法:抽签法和随机数法.(2)系统抽样①步骤:a.先将总体的N个个体编号;b.根据样本容量n,当𝑁𝑛是整数时,取分段间隔k=𝑁𝑛;c.在第1段用简单随机抽样确定第一个个体编号l(l≤k);d.按照一定的规则抽取样本.②适用范围:适用于总体中的个体数较多时.知识梳理典例变式基础训练能力提升知识梳理(3)分层抽样①定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.②适用范围:适用于总体由差异比较明显的几个部分组成时.知识梳理典例变式基础训练能力提升知识梳理2.用样本估计总体(1)统计图表①频率分布直方图的画法步骤a.求极差(即一组数据中最大值与最小值的差);b.决定组距与组数;c.将数据分组;d.列频率分布表;e.画频率分布直方图.②频率分布折线图和总体密度曲线a.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.b.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.知识梳理典例变式基础训练能力提升知识梳理③茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.知识梳理典例变式基础训练能力提升知识梳理(2)样本的数字特征①众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.②中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.③平均数:把𝑎1+𝑎2+…+𝑎𝑛𝑛称为a1,a2,…,an这n个数的平均数.④标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x,则这组数据的标准差和方差分别是s=ට1𝑛[(x1-x)2+(x2-x)2+…+(x𝑛-x)2].s2=1𝑛[(x1-x)2+(x2-x)2+…+(xn-x)2].⑤平均数、方差的有关性质若x1,x2,…,xn,的平均数为x,则mx1+a,mx2+a,…,mxn+a的平均数为mx+a.若x1,x2,…,xn,的方差是s2,则mx1+a,mx2+a,…,mxn+a的方差为m2s2.知识梳理典例变式基础训练能力提升知识梳理3.两变量间的相关关系与统计案例(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)回归方程为y^=b^x+a^,其中b^=∑𝑖=1𝑛xiyi-𝑛xy∑i=1nx𝑖2-𝑛x2,a^=𝑦−b^x.知识梳理典例变式基础训练能力提升知识梳理(4)相关系数r=∑𝑖=1𝑛(x𝑖-x)(𝑦𝑖-𝑦)ඨ∑𝑖=1𝑛(x𝑖-x)2∑𝑖=1𝑛(𝑦𝑖-𝑦)2当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.知识梳理典例变式基础训练能力提升知识梳理4.非线性回归分析如果在样本数据的散点图中,样本点并没有分布在某一条直线附近,而是分布在某一条曲线(如二次函数、指数函数、对数函数等)的周围,我们就称这两个变量之间不具有线性相关关系,而是非线性相关关系.对这样的两个变量进行回归分析,称为非线性回归分析.5.独立性检验(1)假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为,如下表所示:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d知识梳理典例变式基础训练能力提升知识梳理K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑎+𝑐)(𝑏+𝑑)(𝑐+𝑑)(其中n=a+b+c+d为样本容量).(2)两个分类变量A和B是否有关系的判断方法①当K2≤2.706时,...