流行病学数据统计分析策略中南大学湘雅公共卫生学院谭红专教授24/12/282主要内容概述专题研究的数据分析常规收集的流行病学数据的分析24/12/283第一节概述流行病学研究与流行病学数据流行病学数据分析的目的流行病学数据中的变量分类流行病学数据分析的内容24/12/284一、流行病学研究与流行病学数据狭义的流行病学数据(epidemiologicaldata)指任何来自针对明确研究目的而开展特定流行病学研究所收集的资料
广义的流行病学数据还包括出于其他目的和用途而收集的、可以用来定量地探索疾病健康或医疗卫生服务其他问题的资料
即一切可为流行病学所用的数据
目前的临床大数据是个宝库
24/12/285二、流行病学数据分析的目的流行病学数据分析是针对明确研究问题、具有明确目的、采用特定方法对流行病学数据进行统计整理、统计描述、统计推断和总结
流行病学研究的问题涉及疾病分布、病因与危险因素、诊断、预防和治疗效果评价等
数据分析的根本是正确地回答有意义的问题,而不是统计学数字游戏
24/12/286流行病学数据分析的目的估计有关统计学指标,如相对危险度;估计该统计学指标的可信区间;控制可能的混杂因素;分析剂量反应关系;分析可能的效应修饰因子;分析可能存在的偏倚
24/12/287三、流行病学数据中的变量分类典型的流行病学研究中变量可根据其用途分为五类:暴露变量:因,自变量,可以有多个结局变量:果,因变量,是数据分析的核心混杂因素:需要控制效应修饰因素:需要描述其他变量:24/12/288按统计学分类定性:二分类和多分类(无序多分类)定量:在多数流行病学研究中被转化为分类变量半定量(分级,有序多分类)同一个研究中,因变量和自变量的关系应该是固定的、不能互换
但在不同的研究中,一个变量在这个研究中可能是果,在另一个研究中也可能