简单线性回归Linearregression回归是设法找出变量间在数量上的依存变化关系,用函数表达式表达出来,这个表达式称之为回归方程
两变量间的关系确定性关系:两变量间的函数关系圆的周长与半径的关系:C=2R速度、时间与路程的关系:L=STX与Y的函数关系:Y=a+bX非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达
青少年身高与年龄的关系;身高与体重的关系:标准体重(kg)=身高(cm)-105药物浓度与反应率的关系;一、线性回归的概念当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系
其中X为自变量(independentvariable);Y是因变量(dependentvariable)
但在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程来准确反映,为了区别于两变量间的函数方程,我们称这种关系为回归关系,用直线方程来表示这种关系称为回归直线或线性回归
Yabx小插曲:为什么叫”回归“
GaltonK
Pearson二、回归参数的估计式中的是由自变量X推算应变量Y的估计值,a是回归直线在Y轴上的截距;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位
计算原理:最小二乘法,即保证各实测点到回归直线的纵向距离的平方和最小,并使计算出的回归方程最能代表实测数据所反映出的直线趋势
YabxY22ˆYYYabXXbYaXXXYllXXYYXXb2)())((例12-1某医师为了研究正常成年男性的运动后最大心率与年龄的关系,测得20名正常成年男性的有关数据,散点图如下
年龄504846444240383634心率200190180170160150140130年龄与运动后最大心