下载后可任意编辑回归分析和独立性检验一、回归分析1、回归直线方程 (叫做解释变量,叫做预报变量)其中= (由最小二乘法得出,考试时给出此公式中的一个) ( 此式说明:回归直线过样本的中心点 ,也就是平均值点。 )2、几条结论:(1)回归直线过样本的中心点。(2)b>0 时,y 与 x 正相关,散点图呈上升趋势;b<0 时,y 与 x 负相关,散点图呈下降趋势。(3)斜率 b 的含义(举例):假如回归方程为 y=2.5x+2, 说明 x 增加 1 个单位时,y 平均增加 2.5 个单位;假如回归方程为 y=-2.5x+2,说明 x 增加 1 个单位时,y 平均减少 2.5 个单位。(4)相关系数表示变量的相关程度。 范围:,即 越大,相关性越强。时,y 与 x 正相关;时,y 与 x 负相关。 (5)相关指数表示模型的拟合效果。 范围:越大,拟合效果越好,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀,带状区域宽度越窄,拟合精度越高)。表示解释变量对于预报变量变化的贡献率。例如:,表明“解释了 64%的变化”,或者说“的差异有 64%是由引起的”。(6)线性回归模型 , 其中叫做随机误差。(是由和共同确定的。)二、独立性检验1、原理:假设性检验(类似反证法原理)。一般情况下:假设分类变量 X 和 Y 之间没有关系,通过计算值,然后查表对比相应的概率 P,发现这种假设正确的概率 P 很小,从而推翻假设,最后得出 X 和 Y 之间有关系的可能性为(1-P),也就是“X 和 Y 有关系”。(表中的就是的观测值,即)第 1 页 共 3 页下载后可任意编辑2、22 列联表:(考试给出)部分对比表(考试时会给出用到的一部分数据):3、范围:; 性质:越大,说明变量间越有关系。三、典型例题例 1、右表中是生产某种产品(吨)与相应消耗的煤(吨)记录数据:(1)画出数据的散点图;(2)求线性回归直线方程;(3)估量生产 7 吨产品时,消耗的煤约为多少吨?解:(1)散点图如右。从图中可以看出与正相关。(2)(提示:把原数据表抄一遍,并且增加 2 行和 1 列,计算出后面需要用到的数据)设回归直线方程为 =0.7, 所以,回归方程为:(3)当时, 所以,估量生产 7 吨产品时,消耗的煤约为 5.25 吨。例 2、为了考察某药物预防疾病的效果,现对 105 人进行试验调查,得到 22 列联表。试推断:服用药物和患病之间是否有关系?解:,,,,第 2 页 共 3 页总计总计P0.100.0...