总体特征数的估计和线性回归方程思考过程在统计学中,我们想了解某个总体的某些特征量,比如今年某省高考的数学平均成绩,根据近些年某地区的1月份的平均气温来估计今年1月份的平均气温等问题,这里的“数学平均成绩”“平均气温”就是我们所要了解的总体特征量,通常我们是从总体中先抽取一个样本,通过样本的特征量来反映总体的相应特征量,即用样本来估计总体,这是统计学的一个基本思想.所谓的总体特征量就是能反映总体某些特征的量.如总体平均数、方差、标准差等.对数据的刻画,一般从两个方面:一种是数据的集中趋势,如数据的平均数、中位数、众数等统计量;另一种是数据的离散性度量,如数据的极差、方差及标准差等统计量.根据实际问题的需求合理地选取一个样本,从样本数据中提取基本的数字特征(如平均数、方差等),并能作出合理的解释,这是学习统计的基本目标之一.在本节中,我们要学会从所抽取的样本数据中提取数据信息的能力,即会求数据的平均数、方差、标准差等,还要会用这些数据特征量去估计总体的相应的特征量.1.平均数:若给定一组数据x1,x2,…,xn,则平均数=xi(i=1,2,3,…,n),通常用样本平均数来估计总体平均数.2.平均数的性质:(1)若给定一组数据x1,x2,…,xn的平均数为,则ax1,ax2,…,axn的平均数为a;(2)若给定一组数据x1,x2,…,xn的平均数为,则ax1+b,ax2+b,…,axn+b的平均数为a+b;(3)若给定的一组数据x1,x2,…,xn较大,直接求平均数较为烦琐时,可以将每个数据都减去常数a,得到一组新数据x′1,x′2,…,x′n,计算出新数据组的平均数为,则原数据组的平均数为+a.3.方差:若给定一组数据x1,x2,…,xn,则(xi-)2称作样本方差,记作s2,它的算术平方根称作标准差,记作s,即s=.4.方差的性质:(1)若给定一组数据x1,x2,…,xn,方差为s2,则ax1,ax2,…,axn的方差为a2s2;(2)若给定一组数据x1,x2,…,xn,方差为s2,则ax1+b,ax2+b,…,axn+b的方差为a2s2;特别地,当a=1时,则有x1+b,x2+b,…,xn+b的方差为s2,这说明将一组数据的每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性;(3)方差刻画了数据相对于均值的平均偏离程度;对于不同的数据集,当离散程度越大时,方差越大;(4)方差的单位是原始测量数据单位的平方,对数据中的极值较为敏感,标准差的单位与原始测量数据单位相同,可以减弱极值的影响.5.线性回归(1)统计相关变量之间虽然存在着密切的关系,但从一个变量的每一个确定的值,不能求出另一个变量的确定的值,可是在大量的试验中,这种确定的联系,具有统计规律性,这种联系称作统计相关性.(2)线性回归方程通过收集现实生活中两个有关联的变量的数据作出散点图,如果所有的散点分布成或近似成一条直线,我们说这两个变量有线性关系(否则就说两个变量不具有线性关系),然后运用最小二乘法的思想,用一条直线来拟合两个变量之间的关系:y=a+bx.要求所有点相对于该直线的偏差的平方和尽可能达到最小.我们把y=a+bx称作线性回归方程,其中用心爱心专心b=.(*)求线性回归方程的一般步骤:①根据两组数据计算,,xi,yi,xi2,xiyi;②代入(*)计算得a,b的值;③代入y=a+bx.用心爱心专心