第1页共3页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共3页《金融统计分析》补充知识1、均值:均值又称算术平均数,是所有观察值的和除以观察值的个数,是集中趋势的最主要测度值
¯X=X1+X2+⋯+XNN=∑i=1NXiN2、方差:方差是个变量与其均值离差平方的平均数,是测度数据离散程度的主要方法
σ2=∑i=1K(Xi−¯X)2N3、标准差:方差的平方根即为标准差
σ=√∑i=1K(Xi−¯X)2N4、相关系数:设(xi,yi),i=1,2,…,n是(x,y)的n组样本观测值,我们称r=Lxy√LxxLyy为x与y的相关系数,表示x和y的线性关系的密切程度
其中Lxx=∑i=1n(xi−¯x)2,Lxy=∑i=1n(xi−¯x)(yi−¯y),Lyy=∑i=1n(yi−¯y)2相关系数的取值范围|r|≤1
5、一元线性回归直线回归分析的任务就是根据若干观测值(xi,yi)i=1,2…n找出两个变量x、y之间的关系的直线回归方程^y=a+bx,其中a称为截距,b为回归直线的斜率,也称回归系数
其中^y是变量y的估计值
求直线回归方程^y=a+bx,实际上是用回归直线拟合散点图中的各观测点
常用的方法是最小二乘法,也就是使该直线与各点的垂直距离最小,即求使观察值y与回归直线^y之差的平方和∑(y−^y)2达到最小时的a和b的问题
在判定一个线性回归方程的拟合优度时,R2系数是一个重要的判定指标,公式为R2=∑(^yi−¯y)2∑(yi−¯y)2
从公式中可以看出,判定系数等于回归平方和在总平方和总所占的比率,即回归方程所能解释的因变量变异性的百分比
如果R2=0
775,说明变量y的变异性中有77
5%是由自变量x引起的;如果R2=1,表示所有的观测点全部落在回归直线上;如果R2=0,则表示自变量与因变量无线性关系
6、多元线性回归第2页共3页第1