线性回归方程(1) 情境: 客观事物是相互联系的,过去研究的大多数是因果关系。比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说。事实上数学和物理成绩都是“ 果” , 而真正的“因”是学生的理科学习能力和努力程度。所以说,函数关系存在着一种确定性关系。但还存在着另一种非确定性关系——相关关系。问题: 某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某 6 天卖出热茶的杯数与当天气温的对照表:气温/0C261813104 -1杯数202434385064如果某天的气温是 -50C ,你能根据这些数据预测这天小卖部卖出热茶的杯数吗 ? 为了了解热茶销量与气温的大致关系 , 我们以横坐标 x 表示气温,纵坐标 y 表示热茶销量,建立直角坐标系 . 将表中数据构成的 6 个数对表示的点在坐标系内标出,得到下图。今后我们称这样的图为散点图 (scatterplot). 选择怎样的直线近似地表示热茶销量与气温之间的关系 ? 我们有多种思考方案 :(1) 选择能反映直线变化的两个点 , 例如取(4,50),(18,24)( 2 )取一条直线 , 使得位于该直线一侧和另一侧的点的个数基本相同;( 3 )多取几组点 , 确定几条直线方程 , 再分别算出各条直线斜率、截距的平均值 , 作为所求直线的斜率、截距; ……………… 怎样的直线最好呢 ?这两点的直线;建构数学 ˆybxaˆybxa1. 最小平方法: 用方程为的点,应使得该直线与散点图中的点最接近 那么,怎样衡量直线与图中六个点的接近程度呢? 的直线拟合散点图中ˆyx26,18,13,10,4,babababababa我们将表中给出的自变量带入直线方程 , 得到相应的六个值:的六个值 它们与表中相应的实际值应该越接近越好 . 22222222( , )(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Q a bbababababababaabba 所以 , 我们用类似于估计平均数时的思想 , 考虑离差的平方和 ( , )Q a bˆybxa是直线在垂直方向 ( 纵轴方向 ) 上的距离的平方和 , 可以用来衡量与各散点ˆybxa,a b( , )Q a b与图中六个点的接近的值 , 使达到最小值 . 这种方法叫做最小平方法( 又称最小二乘法 ) . 程度 , 所以 , 设法取直线线性相关关系: 像这样能用直线方程 ˆybxa近似表示的相关关系叫做线性相关关系 .x1x2...