第三节变量间的相关关系与统计案例1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程.3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.4.了解回归分析的基本思想、方法及其简单应用.1.相关性(1)线性相关:若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的,此时可用一条直线来近似.(2)非线性相关:若两个变量x和y的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关,此时可用一条曲线来拟合.(3)不相关如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.2.最小二乘法(1)最小二乘法:如果有n个点(x1,y1),(x2,y2)……,,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2……++[yn-(an+bxn)]2使得上式达到最小值的直线y=a+bx即所求直线,这种方法称为最小二乘法.(2)线性回归方程:线性回归方程为y=bx+a,其中b=niiniiixnxyxnyx1221,a=-b.3.相关系数r(1)r=niiniiniiiyyxxyyxx12121)()())((=.(2)当r>0时,称两个变量正相关.当r<0时,称两个变量负相关.当r=0,称两个变量线性不相关.r的绝对值越接近于1,表明两个变量之间的线性相关程度越高;r的绝对值越接近于0,表明两个变量之间的线性相关程度越低.4.独立性检验(1)2×2列联表:设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1,通过观察得到下表所示的数据:BAB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.(2)独立性判断方法:选取统计量χ2=,用它的大小来检验变量之间是否独立.①χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;②χ2>2.706时,有90%的把握判定变量A,B有关联;③当χ2>3.841时,有95%的把握判定变量A,B有关联;④当χ2>6.635时,有99%的把握判定变量A,B有关联.相关关系和函数关系有何异同点?提示:(1)相同点:两者均是指两个变量的关系.(2)不同点:①函数关系是一种确定的关系,而相关关系是一种非确定的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.1.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为y=0.95x+a,则a=()x0134y2.24.34.86.7A.3.25B.2.6C.2.2D.0解析:选Bx=2,y=4.5,因为回归方程经过点(x,y),所以a=4.5-0.95×2=2.6.2.若回归直线方程为y=2-1.5x,则变量x增加一个单位,y()A.平均增加1.5个单位B.平均增加2个单位C.平均减少1.5个单位D.平均减少2个单位解析:选C因为回归直线方程为y=2-1.5x,所以b=-1.5,则变量x增加一个单位,y平均减少1.5个单位.3.下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:x3456y2.5t44.5根据上表提供的数据,求出y关于x的线性回归方程为y=0.7x+0.35,那么表中t的值为()A.3B.3.15C.3.5D.4.5解析:选A样本点的中心(,),即.因为回归直线过该点,所以=0.7×4.5+0.35,解得t=3.4.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.y=-10x+200B.y=10x+200C.y=-10x-200D.y=10x-200解析:选A由于销售量y与销售价格x负相关,因此回归方程中的系数b<0,故排除选项B,D;选项C中,当x=0时,y=-200,与实际问题不符合,故排除选项C.5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若χ2的值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C....