2.4线性回归方程(1)教学目标(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;(2)在两个变量具有线性相关关系时,会在散点较长中作出线性直线,会用线性回归方程进行预测;(3)知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.教学重点散点图的画法,回归直线方程的求解方法.教学难点回归直线方程的求解方法.教学过程一、问题情境1.情境:客观事物是相互联系的奎屯王新敞新疆过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系奎屯王新敞新疆比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说奎屯王新敞新疆事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度奎屯王新敞新疆所以说,函数关系存在着一种确定性关系奎屯王新敞新疆但还存在着另一种非确定性关系——相关关系奎屯王新敞新疆2.问题:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:气温/0C2618131041杯数202434385064如果某天的气温是50C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?二、学生活动为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;用心爱心专心………………怎样的直线最好呢?三、建构数学1.最小平方法:用方程为ˆybxa的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。那么,怎样衡量直线ˆybxa与图中六个点的接近程度呢?我们将表中给出的自变量x的六个值带入直线方程,得到相应的六个ˆy的值:26,18,13,10,4,babababababa.这六个值与表中相应的实际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和22222222(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Qabbababababababaabba(,)Qab是直线ˆybxa与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线ˆybxa与图中六个点的接近程度,所以,设法取,ab的值,使(,)Qab达到最小值.这种方法叫做最小平方法(又称最小二乘法).先把a看作常数,那么Q是关于b的二次函数.易知,当140382021286ab时,Q取得最小值.同理,把b看作常数,那么Q是关于a的二次函数.当14046012ba时,Q取得最小值.因此,当14038202128614046012abba时,Q取的最小值,由此解得1.6477,57.5568ba.所求直线方程为ˆ1.647757.5568yx.当5x时,ˆ66y,故当气温为50C时,热茶销量约为66杯.2.线性相关关系:像能用直线方程ˆybxa近似表示的相关关系叫做线性相关关系.3.线性回归方程:一般地,设有n个观察数据如下:x1x2x3x…nx用心爱心专心y1y2y3y…ny当,ab使2221122()()...()nnQybxaybxaybxa取得最小值时,就称ˆybxa为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.上述式子展开后,是一个关于,ab的二次多项式,应用配方法,可求出使Q为最小值时的,ab的值.即1112211()()()nnniiiiiiinniiiinxyxybnxxaybx,(*)niixnx11,niiyny11四、数学运用1.例题:例1.下表为某地近几年机动车辆数与交通事故数的统...