用样本估计总体与用样本估计总体与变量间的相关关系变量间的相关关系考点考点11考点考点22考点考点33填填知学情填填知学情课内考点突课内考点突破破规律探究规律探究考纲解读考纲解读考向预测考向预测考点考点44考点考点55考点考点66考纲解读考纲解读1.用样本估计总体(1)了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差(不要求记忆公式).(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.2.变量的相关性(1)会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).2012年高考,试题难度仍以中低档题为主.对总体分布的估计、线性回归很可能在选择、填空题中考查.对于频率分布直方图,求线性回归方程以及回归分析、独立性检验与假设检验等,由于计算量大,因此考解答题的可能性不大,但也不排除给出数据、公式,以选择题形式考查.考向预测考向预测1.用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况.比例大小(2)频率分布折线图连接频率分布直方图中各小长方形,就得到频率分布折线图.(3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(4)茎叶图2.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数上端的中点众数:在样本数据中,频率分布最大值所对应的样本数据;中位数:样本数据中,累积频率为0.5时所对应的样本数据值(累积频率:样本数据小于某一数值的频率叫做该数值点的累积频率);平均数:样本数据的算术平均数,即x=.(2)标准差的计算公式:s=.3.从散点图上看,点散布在就称这种相关关系为正相关,如果点散布在)xx(xn1n21+…++从左下角到右上角的区域内从左上角到右下角的区域内就称这种相关关系为负相关.[]2n2221x)-(xx)-(xx)-(xn1+…++4.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有,这条直线叫做回归直线,回归直线方程常记作.5.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),用最小二乘法,求回归直线系数a,b的公式为b==,a=.其中,x=,y=.y-bxxn1in1i∑=yn1in1i∑=线性相关关系x)-(xy)-x)(y-(x2in1iiin1i∑∑==nx-xyxn-yx22in1iiin1i∑∑==bx+a=yˆ通过求Q=的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法.(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2[2010年高考安徽卷]某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.考点考点11绘制频率分布直方图绘制频率分布直方图【分析】按要求列表、绘图,用样本的分布估计总体的分布.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.分组频数频率[41,51)2[51,61)1[61,71)4[71,81)6[81,91)10[91,101)5[101,111)2【【解析解析】】(1)(1)频率分布表如下频率分布表如下::3023013043023063010302(2)频率分布直方图如图.(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量...