卫生统计学 Statistics第一章 绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。总体:根据讨论目的确定的同质(大同小异)的观察单位的全体。分为目标总体和讨论总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。抽样:从讨论总体中抽取少量有代表性的个体。变量:表现出个体变异性的任何特征或属性。分定型变量和定量变量。定型变量:1)分类变量或名义变量:最简单的是二分类变量。0-1 变量也常称为假变量或哑变量。2)有序变量或等级变量。定量变量:分离散型变量和连续型变量。变量只能由高级向低级转化:定量→有序→分类→二值。常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。 2)计数资料或分类资料,如性别、血型等。 3)等级资料,如尿蛋白含量-、+、++、+++、…第一章 定量变量的统计描述此章节 x 即为样本均数(X 拔)1.离散型定量变量的取值是不连续的。累计频数为该组及前面各组的频数之和。累计频率表示各组累计频数在总例数中所占的比例。可用直条图表达。2.编制频数表的步骤与要点步骤:1 确定极差 2 确定组数 3 确定各组段的上下限 4 列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。2)为计算方便,组段下限一般取较整齐的数值 3)第一组段应包含最小值,最后一个组段应包含最大值。3.频率分布表(图)的用途1)描述变量的分布类型 2)揭示变量的分布特征 3)便于发现某些离群值或极端值 4)便于进一步计算统计指标和统计分析。4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。总体均数用 μ 表示,样本均数用 X 表示。适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。分:直接法和频率表法。即所有变量值加和除以总数 n 或所有频数 fk乘以组中值 X0k后求和再除以总数 n。 X0k=(第 k 组段上限+第 k组段下限)/2几何均数(G):适用于原始观察值分布不对称,但经对数转换后呈对称分布的变量。,如正态分布或数据呈倍数变化的资料。公式:直接法和频率表法。 中位数(M):将原始观察值按由小到大顺序排列后,位次居中的那个数值,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的和的平均值。适用于各种分布的变...