线性回归线性回归问题 1 :正方形的面积 y 与正方形的边长 x之间 的函数关系是y = x2确定性关系问题 2 :某水田水稻产量 y 与施肥量 x 之间是 否有一个确定性的关系?例如:在 7 块并排、形状大小相同的试验田 上进行施肥量对水稻产量影响的试验, 得到如下所示的一组数据:施化肥量 x 15 20 25 30 35 40 45水稻产量 y 330 345 365 405 445 450 455一、线性回归分析当施肥量 x 一定时,水稻产量 y 的值带有一定的随机性 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1 、定义: 1 ):相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2 ):相关关系函数关系相同点不同点均是指两个变量的关系 非确定关系 非随机变量与随机变量的关系确定的关系两个非随机变量的关系二、现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等等等三、回归分析实质:通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。定义:对具有相关关系的两个变量进行统计分析的方法。施化肥量 x15202530354045水稻产量 y330345365405445450455例 1 :在 7 块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据 ( 单位: kg) :2. 散点图:( 1 )定义:表示具有相关关系的两个变量的 一组数据的图形。( 2 )作用:形象反映各对数据的密切程度。XYOO3 、观察散点图的特征 发现各点大致分布在一条直线的附近。 XYOO哪一条最能代表变量 X 与 Y之间的关系呢?这样的直线可以画多少条呢?ˆybxaˆ(1,2,, )iiybxa inix,b a其中 是待确定的参数,于是,当变量 x 取一组数值 时,相应地4 、一般地,设 x 与 y 是具有相关关系的两个变量,且相应于 n 个观测值的 n 个点大致分布在一条直线的附近,我们来求在整体上与这 n 个点最接近的一条直线。( 1 )设所求的直线的方程是 :( 2 )各个偏差:ˆ(),iiiiipyyybxa(1,2,, )in的符号有正有负,相加会相互抵消。ip的和不能代表 n 个点与相应直线在整体上的接近程度。ip2211222()()()nnQybxaybxaybxa用 Q 来表示 n 个点与相应直线在整体上的接近程度。21()niiiQybxa...