回归分析应用最广泛的一种办法
但回归分析要求大样本,只有通过大量的数据才能得到量化的规律,这对很多无法得到或一时缺乏数据的实际问题的解决带来困难
回归分析还要求几样本有较好的分布规律,而很多实际情形并非如此
例如,我国建国以来经济方面有次大起大落,难以满足样本有较规律的分布要求
因此,有了大量的数据也不一定能得到统计规律,甚至即使得到了统计规律,也并非任何情况都可以分析
另外,回归分析不能分析因素间动态的关联程度,即使是静态,其精度也不高,且常常出现反常现象前面我们讲过曲线拟合问题
曲线拟合问题的特点是,根据得到的若干有关变量的一组数据,寻找因变量与(一个或几个)自变量之间的一个函数,使这个函数对那组数据拟合得最好
通常,函数的形式可以由经验、先验知识或对数据的直观观察决定,要作的工作是由数据用最小二乘法计算函数中的待定系数
从计算的角度看,问题似乎已经完全解决了,还有进一步研究的必要吗
从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些系数,只是它们的一个(点)估计,应该对它们作区间估计或假设检验,如果置信区间太大,甚至包含了零点,那么系数的估计值是没有多大意义的
另外也可以用方差分析方法对模型的误差进行分析,对拟合的优劣给出评价
简单地说,回归分析就是对拟合问题作的统计分析
数据的标准化处理数据的中心化处理是指平移变换数据的无量纲化处理在实际问题中,不同变量的测量单位往往是不一样的
为了消除变量的量纲效应,使每个变量都具有同等的表现力,数据分析中常用的消量纲的方法,是对不同的变量进行所谓的压缩处理,即使每个变量的方差均变成1标准化处理所谓对数据的标准化处理,是指对数据同时进行中心化-压缩处理一元线性回归假设对于的n个值,得到的n个相应的值,确定的方法是根据最小二乘准则,要使取最小值
利用极值必要条件令,求的估计值,从而得到回归直线
只不过这个过程可