卫生统计学 Statistics第一章 绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果
总体:根据讨论目的确定的同质(大同小异)的观察单位的全体
分为目标总体和讨论总体
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)
样本应具有代表性
所谓有代表性的样本,是指用随机抽样方法获得的样本
抽样:从讨论总体中抽取少量有代表性的个体
变量:表现出个体变异性的任何特征或属性
分定型变量和定量变量
定型变量:1)分类变量或名义变量:最简单的是二分类变量
0-1 变量也常称为假变量或哑变量
2)有序变量或等级变量
定量变量:分离散型变量和连续型变量
变量只能由高级向低级转化:定量→有序→分类→二值
常见的三种资料类型1)计量或测量或数值资料,如身高、体重等
2)计数资料或分类资料,如性别、血型等
3)等级资料,如尿蛋白含量-、+、++、+++、…第一章 定量变量的统计描述此章节 x 即为样本均数(X 拔)1
离散型定量变量的取值是不连续的
累计频数为该组及前面各组的频数之和
累计频率表示各组累计频数在总例数中所占的比例
可用直条图表达
编制频数表的步骤与要点步骤:1 确定极差 2 确定组数 3 确定各组段的上下限 4 列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细
2)为计算方便,组段下限一般取较整齐的数值 3)第一组段应包含最小值,最后一个组段应包含最大值
频率分布表(图)的用途1)描述变量的分布类型 2)揭示变量的分布特征 3)便于发现某些离群值或极端值 4)便于进一步计算统计指标和统计分析
描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平
总体均数用 μ 表示,样本均数用 X 表示
适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值