百度文库- 让每个人平等地提升自我1 第一章方差分析例 1、 1977 年,美国的某项调查从三种受过不同教育类型的妇女中各分别抽取了50 位全日制工作的妇女样本,她们的年收入(单位:千美元)数据整理后归纳如下:完成的学历年数收入平均值X () 2)(XX初中( 8 年) X1 高中( 12 年) X2 大学( 16 年) X3 1835 2442 4707 解:: = :三组收入均值有显著差异F =,即组间均方 / 组内均方其中,组间自由度=3-1=2 ,组内自由度=(50-1) ╳3=147 由于样本均值=++/3= 所以组间偏差平方和=50=50*(++)=1009 组内偏差平方和==1835+2442+4707=8984 所以, F = ≈ >(2,147)= 拒绝原假设;认为不同学历的妇女收入存在差异
例 2、 月收入数据:男: 2500,2550, 2050,2300, 1900 女: 2200,2300, 1900,2000, 1800 如果用 Y 表示收入,哑变量X 表示性别( X=1 为女性),计算 Y 对 X 的回归方程,并在5%的水平下检验收入是否与性别无关(先求回归系数的置信区间)
解: 令Y=+X+根据最小二乘法,可知=(1) VAR()=(2) =(3) 计算如下::收入与性别无关收入与性别不完全无关Y 2500255020502300190022002300190020001800X 0 0 0 0 0 1 1 1 1 1 百度文库- 让每个人平等地提升自我2 240 290 -210 40 -360 160 260 -140 -40 -240 =2150= 根据公式 1,得=-220;,即 Y=-220X+根据公式 2、 3,得 VAR()=≈n=10
,n-2=8;当 df=8 时,= 的置信区间求解方法如下: