1SAS系统与属性数据分析20072007北京大学北京大学2目录1.属性数据2.列联表分析3.属性变量的无关联性检验4.有序变量的关联性分析5Logistic回归分析20072007北京大学北京大学3属性数据为了某种目的通过调查表进行社会调查得到的数据----调查数据,一般都是属性数据。即在许多调查研究中,所得到的信息是样本中个体的分类,而不是定量变量的值。例如,在某次调查中,根据人们的性别,对颜色的喜好等,将他们分类。在某次政府调查中,根据公司的产品类型,公司的所在地区,及产品是否出口,将这些公司分为不同组。在市场研究中,为了了解一种新产品的吸引力,根据顾客是否已看到这种新产品的广告以及是否已购买了该新产品,将顾客分为不同组。这种类型的数据可以方便地汇总在一张表格中,用来表示每个组中的观测个数。20072007北京大学北京大学4属性数据例1性别与所喜爱颜色的调查表假定随机地抽取100个人,提问每个人下面的问题:红、兰、绿三色中,你最喜欢那种颜色?那么将结果整理为以下最简单的一张调查汇总表(见下表)我们关心的问题是性别不同是否与所喜爱的颜色有关.双向列联表:性别×颜色20072007北京大学北京大学5属性数据例2为了比较两种冶疗方法的效果,将患者随机地分为两个处理组,每组50人。分别用两种方法治疗一段时间后,记录患者的状态(全愈,未愈)。假定得到的结果见下表。我们关心的问题是两种方案的疗效是否有显著的差别?哪种冶疗方案更好些。20072007北京大学北京大学11属性数据属性数据与连续数据分析属性数据分析(Categoricaldataanalysis)是当目标变量为属性记录时的数据分析,不管问题的预测变量(自变量)是否为属性或连续的。属性变量的结果通常反映属性分类的信息。连续数据分析(Continuousdataanalysis)是当目标变量为连续记录时的数据分析,也不论它的预测变量是属性的或连续的。20072007北京大学北京大学12属性数据属性数据与连续数据分析目标变量20072007北京大学北京大学13属性数据属性数据分析20072007北京大学北京大学14属性数据属性数据分析对属性数据进行分析,将达到以下几方面的目的:①产生汇总分类数据----列联表;②检验属性变量间的独立性(无关联性);③计算有序的属性变量间的关联性统计量;④对高维数据进行分层分析和建模20072007北京大学北京大学15列联表分析属性变量取值的频数表对属性变量最基本的统计特征就是它可取到的不同数值及取各个不同数值的频数和概率(频率).(中学生数据的频数表和条形图.)20072007北京大学北京大学19列联表分析多个属性变量取值的交叉表20072007北京大学北京大学20列联表分析由原始数据生成列联表的例子例2.1对某个“统计入门”课题,记录了该课程中所有学生的性别和专业(′是′为统计专业,′非′为其他专业).数据见以下SAS程序的数据行.试用编程方法或菜单系统生成列联表.解(1)使用FREQ过程来生成列联表.下面的DATA步用来生成该数据集,然后使用FREQ过程生成列联表,其中TABLES语句要求用分类变量性别(SEX)和主修专业(MAJOR)来生成列联表.这些语句产生的输出见上页.20072007北京大学北京大学21datastatclas;inputstudentsex$major$@@;cards;1男是2男非3女是4男非5女是6女是7男非8男非9男是10女是11男非12女是13男是14男是15男非16女是17男是18男非19女非20男是;procfreqdata=statclas;tablessex*major;title′统计课程中学生的专业和性别′;run;列联表分析由原始数据生成列联表的例子(cate21.sas)20072007北京大学北京大学22(2)使用SAS菜单系统“分析员应用”生成列联表.首先启动“分析员应用”,并打开SAS数据集STATCLAS.进行列联表分析的步骤如下:①在“分析员应用”菜单栏目中选分析(Statistics)=>表分析(TableAnalysis)....②在弹出的列联表分析主窗口中选择行变量和列变量:SEX=>Row,MAJOR=>Column.列联表分析由原始数据生成列联表的例子20072007北京大学北京大学23列联表分析由原始数据生成列联表的例子行分类变量列分类变量单元记数变量分层变量20072007北京大学北京大学24列联表分析由原始数据生成列联表的例子指定分类变量输出次序的原则各单元输出的内容关联统计量设...