《金融统计分析》补充知识1、均值:均值又称算术平均数,是所有观察值的和除以观察值的个数,是集中趋势的最主要测度值。¯X = X1+X 2+⋯+X NN=∑i=1NXiN2、方差:方差是个变量与其均值离差平方的平均数,是测度数据离散程度的主要方法。σ2=∑i=1K( Xi− ¯X )2N3、标准差:方差的平方根即为标准差。σ=√∑i=1K( Xi− ¯X )2N4、相关系数:设(xi, yi),i=1,2,…,n 是(x,y)的 n 组样本观测值,我们称r=Lxy√ Lxx Lyy为 x 与 y 的相关系数,表示 x 和 y 的线性关系的密切程度。其中Lxx=∑i=1n(xi−¯x)2, Lxy=∑i=1n( xi−¯x)( yi−¯y ),L yy=∑i=1n( yi−¯y )2相关系数的取值范围|r|≤1。5、一元线性回归直线回归分析的任务就是根据若干观测值(xi,yi)i=1,2…n 找出两个变量 x、y 之间的关系的直线回归方程^y=a+bx ,其中 a 称为截距,b 为回归直线的斜率,也称回归系数。其中^y 是变量 y 的估计值。求直线回归方程 ^y=a+bx ,实际上是用回归直线拟合散点图中的各观测点。常用的方法是最小二乘法,也就是使该直线与各点的垂直距离最小,即求使观察值 y 与回归直线^y 之差的平方和∑( y−^y )2达到最小时的 a 和 b 的问题。在判定一个线性回归方程的拟合优度时,R2系数是一个重要的判定指标,公式为R2=∑ ( ^yi−¯y)2∑ ( yi−¯y)2。从公式中可以看出,判定系数等于回归平方和在总平方和总所占的比率,即回归方程所能解释的因变量变异性的百分比。如果 R2=0.775,说明变量 y 的变异性中有 77.5%是由自变量 x 引起的;如果 R2=1,表示所有的观测点全部落在回归直线上;如果 R2=0,则表示自变量与因变量无线性关系。6、多元线性回归根据多个自变量的最优组合建立回归方程来预测因变量的回归分析称为多元回归分析。模型为^y=b0+b1 x1+b2 x2+⋯+bn xn ,其中^y 为根据所有自变量计算出来的估计值,b0为常数项,b1、b2⋯bn称为 y 对应于 x1、x2…xn的偏回归系数。偏回归系数是假设在其他所有自变量保持不变的情况下,某一个自变量的变化引起因变量变化的比重。在判定一个线性回归方程的拟合优度时,R2系数是一个重要的判定指标,公式为R2=∑ ( ^yi−¯y)2∑ ( yi−¯y)2。从公式中可以看出,判定系数等于回归平方和在总平方和总所占的比率,即回归方程所能解释的因变量变异性的百分比。如果 R2=0.775,说明变量 y 的变异性中有 77.5%是由自变量 x 引起的...