统计分析系统SAS软件邓文丽(江西师范大学数学与信息科学学院)Ch11.1用ANOVA过程进行单因素方差分析PROCANOVA可以用于处理均衡设计(即每个因素的每个水平,观测数相等),拉丁方设计,和正交设计等;如果试验设计不是均衡的,建议使用PROCGLM。PROCANOVADATA=数据集;CLASS因素;MODEL指标=因素;RUN;例如:procanovadata=sasuser.veneer;classbrand;modelwear=brand;run;显示结果如下:AnalysisofVarianceProcedureClassLevelInformationClassLevelsValuesBRAND5ACMEAJAXCHAMPTUFFYXTRANumberofobservationsindataset=20DependentVariable:WEARAmountofmaterialwornawaySourceDFSumofSquaresMeanSquareFValuePr>FModel40.617000000.154250007.400.0017Error150.312500000.02083333CorrectedTotal190.92950000R-SquareC.V.RootMSEWEARMean0.6637986.1551200.144337572.34500000SourceDFAnovaSSMeanSquareFValuePr>FBRAND40.617000000.154250007.400.0017结果可以分为四个部分第一部分是因素水平的信息1、因素只有一个BRAND;2、它有5个水平,分别是ACME、AJAX、CHAMP、TUFFY、XTRA;3、共有20个观测。第二部分就是经典的方差分析表表前面指明了因变量(指标)为WEAR1、第一列“来源”说明方差的来源,是模型的(可以用方差分析模型解释的),误差的(不能用模型解释的),还是总和。2、第二列为自由度。3、第三列为平方和,其大小代表了各方差来源作用的大小。4、第四列为均方,即平方和除以自由度。5、第五列F值是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性,如果不显著说明模型对指标的变化没有解释能力。6、第六列是F统计量的p值。由于这里p值小于0.05(我们的检验水平),所以模型是显著的,因素对指标有显著影响。结果的第三部分一些与模型有关的简单统计1、第一个是复相关系数平方,代表总变差中能被模型解释的比例;2、第二个是变异系数;3、第三个是根均方误差,结果的第四部分方差分析表的细化给出了各因素的平方和和F统计量,因为是单因素所以这一行与上面的“模型”一行相同。方差分析数据集的建立技巧方差分析的数据集格式统计分析所用的数据格式和我们在分析整理资料时所用的格式是不同的:-------数据集中应至少有一个结果变量,用于记录不同处理因素水平下观察值的大小;-------至少有一个处理因素变量,用于记录处理因素的类型及其水平数。例1某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量测定,请给出数据集的结构。解:数据集中应有两个变量,x和group。x记录肺活量的大小;group取值为1、2或3,分别代表石棉肺患者、可疑患者及非患者。例2某厂医务室测定了10名氟作业工人工前、工中及工后4小时的尿氟浓度,请给出数据集的结构。解:数据集中应有三个变量,x、group和worker。x记录尿氟浓度;group取值为1、2或3,分别代表工前、工中及工后;worker取值为1到10,分别代表10名工人。方差分析数据集的建立技巧可见方差分析的数据集其变量取值有一定的规律,因此可以利用循环语句和判断语句来简化输入。建立例1的数据集建立例2的数据集PROCGLMGeneralLinearModel用于回归分析、方差分析、协方差分析、多元方差分析和偏相关用于随机效应检验、常用的假设检验对比估计和多变量的对比检验因变量必须是连续性变量,自变量可以是分类变量(需在class中说明),也可以是连续性变量。用GLM进行单因素方差分析PROCGLM选项;CLASS变量表;MODEL因变量=效应/选项;LSMEANS效应/选项;Run;说明:选项:data=数据集,manova计算LSMEANS语句中每一个效应的LSEPage29exe10Datach2exe10;Inputgroupquanti@@;Cards;112118214212213319317321424430;Run;Procanovadata=ch2exe10;Classgroup;modelquanti=group;meansgroup;Run;GLMProcglmData=ch2exe10;Classgroup;modelquanti=group;Lsmeansgroup;Run;1.2用ANOVA过程进行多重比较在ANOVA过程中使用MEANS语句可以进行多重比较。格式如下:MEANS因素/选项;如果不使用选项,则只对因素的各水平计算指标的平均值和标准差,比如:procanovadata=sasuser.venee...