线性回归方程(1) 情境: 客观事物是相互联系的,过去研究的大多数是因果关系
比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说
事实上数学和物理成绩都是“ 果” , 而真正的“因”是学生的理科学习能力和努力程度
所以说,函数关系存在着一种确定性关系
但还存在着另一种非确定性关系——相关关系
问题: 某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某 6 天卖出热茶的杯数与当天气温的对照表:气温/0C261813104 -1杯数202434385064如果某天的气温是 -50C ,你能根据这些数据预测这天小卖部卖出热茶的杯数吗
为了了解热茶销量与气温的大致关系 , 我们以横坐标 x 表示气温,纵坐标 y 表示热茶销量,建立直角坐标系
将表中数据构成的 6 个数对表示的点在坐标系内标出,得到下图
今后我们称这样的图为散点图 (scatterplot)
选择怎样的直线近似地表示热茶销量与气温之间的关系
我们有多种思考方案 :(1) 选择能反映直线变化的两个点 , 例如取(4,50),(18,24)( 2 )取一条直线 , 使得位于该直线一侧和另一侧的点的个数基本相同;( 3 )多取几组点 , 确定几条直线方程 , 再分别算出各条直线斜率、截距的平均值 , 作为所求直线的斜率、截距; ……………… 怎样的直线最好呢
这两点的直线;建构数学 ˆybxaˆybxa1
最小平方法: 用方程为的点,应使得该直线与散点图中的点最接近 那么,怎样衡量直线与图中六个点的接近程度呢
的直线拟合散点图中ˆyx26,18,13,10,4,babababababa我们将表中给出的自变量带入直线方程 , 得到相应的六个值:的六个值 它们与表中相应的实际值应该越接近越好
22222222( ,