1 感谢在校统招的同学帮忙把绝大多数都做了,但可能还是落下了少数题目。如有高手能够补完,还请与其他同学分享。卷 1 一、直方图:直观的给出原始数据(电池寿命)的分布情况箱线图:直观的识别出原始数据(电池寿命)的异常值,并展示出分布的峰度和偏态。二、(1)方差分析中有三个基本的假定。1、正态性:每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本;2、方差齐性:各个总体的方差必须相同;3、独立性:每个样本数据是来自因子各水平的独立样本。(2)在上述 3 个假定中, 对独立性的要求比较严格,若该假设得不到满足时,方差分析的结果往往会受到较大影响。而对正态性和方差齐性的要求相对比较宽松。三、(1)拒绝的结论是: 该食品每袋的平均重量不是100 克;不拒绝的结论是:样本提供的证据不能证明该食品每袋的平均重量不是100 克。(2)不能。 样本得出的结论只能用于拒绝原假设,而不能证明原假设为真。(3)结论: 若该食品每袋的平均重量是100 克,则得到的样本会像现在观测到的结果这样极端或者更极端的概率仅为0.03。解释 P 值:若给定显著性水平为0.05,则可以拒绝原假设,认为该食品每袋的平均重量不是 100 克;但若给定显著性水平为0.01,则不能拒绝原假设。四、(1)若将所有的自变量都引入回归模型,往往会导致所建立的模型不能进行有效的解释,也可能会导致多重共线性。(2)变量筛选有向前选择、向后剔除、逐步回归等方法。特点如下。向前选择:从没有自变量开始,不停向模型中增加自变量,直到增加不能导致 SSE 显著增加为止。2 向后剔除:从所有自变量开始,不停从模型中剔除自变量,直到剔除不能导致 SSE 显著减小为止。逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量, 每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除之。如此反复,直到增加变量不能导致SSE 显著减少为止。五、有季节性多元回归模型、时间序列分解法等方法。季节性多元回归模型引入虚拟变量来表示季节,对于以季度记录的数据,引入 3 个虚拟变量Q1、Q2、Q3,其中 Q1=1(第 1 季度 )或 0(其他季度 ),Q2=1( 第 2 季度 )或 0(其他季度 ),Q3=1(第 3 季度 )或 0(其他季度),则季节性多元回归模型表示为:其中 b0 是时间序列平均值,b1 是去市场分的洗漱,表示趋势给时间序列带来的...