精品文档---下载后可任意编辑(一)基本理论分类变量包括无序分类变量、有序分类变量、多选题变量集
对于分类变量的描述统计,主要是对分类变量各水平值分别进行频数和比例计算,再进步计算所需的一些相对频数指标
一、单分类变量的统计描述1
频数分布分类变量的分析,首先要了解:各类别的样本数(频数),以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比
集中/离散趋势观察原始频数,或者使用众数
对于分类变量,集中/离散趋势是一体的
相对频数指标(1)比(Riatio)两个有关指标之比 A/B, 用来反映相对的大小关系,例如,月销售额/销售人数;(2)构成比用于描述事物内部各构成部分所占的比重,例如,百分比、累积百分比;(3)率(Rate)率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等
二、多分类变量的联合描述列联表
例如,r×c 二维列联表:(1)共 n 个样本;(2)按两种属性 A、B,属性 A 有 r 个水平值:A1, …, Ar; 属性 B 有 c 个水平值:B1, …, Bc
属性 A=Ai,属性 B=Bj的样本数为 nij
= “属性 A=Ai”的合计数,n
j = “属性 B=Bj”的合计数
注:多分类变量对应高维列联表
三、多选题的统计描述多选题是调查问卷的常见题型,因为多选题是回答同一个大问题,所以不能割裂开来单独分析,需要做汇总处理
应答人数(Count)选择各题项的人数,原始频数;2
应答人数百分比选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢迎程度;3
应答人次(Response)选择各选项的总人次,1 个受访者选择 2 个选项,即 2 人次;4
应答次数百分比在做出的所有选择中,选择该项的人次占总人次数的比例
(二)SPS