第65讲回归分析和独立性检验【知识要点】(一)变量间的相关关系、回归分析的基本思想及初步运用一、相关关系1、概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系
2、相关关系与函数关系的异同点
相同点:两者均是指两个变量间的关系
不同点:函数关系是一种确定关系,是一种因果系
如正方形的面积和边长的关系就是一种函数关系
相关关系是一种非确定的关系,也不一定是因果关系
如产品的销售额与广告费的投入的关系
二、散点图表示具有相关关系的两个变量的一组数据的图形叫做散点图
正相关:如果散点图中的点散布在从左小角到右上角的区域内,称为正相关
负相关:如果散点图中的点散布在从左上角到右下角的区域内,称为负相关
注:如果关于两个变量统计数据的散点图呈现发散状,则这两个变量之间不具有相关关系
三、回归分析1、对具有相关关系的两个变量进行统计分析的方法叫回归分析
回归分析的一般步骤为画散点图→求回归直线方程→用回归直线方程进行预报
2、回归直线方程回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线
回归直线方程:设所求的直线方程为,其中,称为样本点的中心,回归直线过样本点的中心
回归方程的截距和斜率是用最小二乘法计算出来的
3、相关系数两个变量之间线性相关关系的强弱用相关系数来衡量
相关系数:,表示两个变量正相关;,表示两个变量负相关;的绝对值越接近1,表明两个变量的线性相关性越强
的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系
通常,的绝对值大于0
75时,表明两个变量的线性相关性很强
4、建立回归模型的基本步骤:①确定研究对象,明确哪个是解释变量,哪个是预报变量;②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系)③由经验确定回归方程的类型(如我们观察到数据