如何做残差分析(2 页)Good is good, but better carries it
精益求精,善益求善
如何做残差分析
残差是指实际观察值与回归估量值的差,即 ,有多少对数据,就有多少个残差
残差分析就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰
可以通过 Matlab 作残差图来分析残差,比如:程序如下: x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164]';X=[ones(16,1) x];Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]';[b,bint,r,rint,stats]=regress(Y,X)rcoplot(r,rint)残差图:24681 01 21 41 6-5-4-3-2-101234R e s id u a l C a s e O rd e r P lo tR e s id u a lsC a s e N u m b e r从残差图可以看出数据的残差离零点的远近,当残差的置信区间均包含零点,这说明回归模型能较好的符合原始数据,否则可视为异常点
剔除异常数据的原则与方法;原则:异常数据是指与其它数据产生的条件有明显不同的数据,因此异常数据的残差会特别的大
一旦发现异常数据应及时剔除,用剩余数据重新建立回归方程,以提高回归方程的质量
发现异常数据主要从技术上找原因,当技术上无法找到原因时,就得借助于数理统计方法
对残差在置信带以外的数据都要进行检查,以区别是否是异常数据,假如是异常数据就要剔除掉
方法㈠:⑴对于线性数列,求出所有相邻两数之差,得到一个新的数列,然后统计新数列的众数(就是出现最多的那个)得到线性数列的公差;⑵然后假设第一个数是非异常数字;⑶假设数据不断加