重庆大学研究生文献综述对医疗大数据的认识名号:指导教师专业重庆大学光电工程学院二 O—六年月11医疗大数据产生的背景在任何一个初具规模的医院,每天接待上万的患者前来就诊,患者的基本信息、影像信息与其他特殊诊疗信息汇集在一起是一个庞大的数据。据统计,上海市区域医疗信息平台(上海市“医联工程”及县区卫生数据中心)已经积累了覆盖 3900 万人群、1400TB 数据量的电子诊疗与健康档案等医疗卫生数据(涵盖了全市 38 家三级医院 3900 万就诊人群的医疗信息,包括患者基本信息、就诊信息、健康档案、检验及影像检查报告、医学影像图像文件、住院相关病历、医保结算等医疗卫生数据,涉及就诊记录 2.1 亿条,处方记录 9.1 亿条)。日积月累,这个数据量将会持续快速增长,为医院的数据存储、集成、调用等应用带来巨大压力。除了数据规模巨大之外,医疗行业的数据类型和结构极其复杂,如PACS 影像、B 超、病例分析等业务产生的非结构化数据,这些数据存储复杂,并且对传统的处理方法和技术带来巨大挑战【1】。医疗大数据得到人们的关注,并渴望有一种新的技术可以从这些看似杂乱无章的数据中得到价值。目前,为了提高人们的健康水平以及医疗水平,医疗行业在大数据环境下的各个领域异常活跃[2]。2医疗大数据的相关概念2.1医疗大数据的定义医疗数据是医生对患者诊疗和治疗过程中产生的数据,包括患者基本数据、入出转数据、电子病历、诊疗数据、医学影像数据、医学管理、经济数据等,以患者为中心,成为医疗信息的主要来源。随着医疗卫生信息化建设进程的不断加快,医疗数据的类型和规模正以前所未有的速度快速的增长,以至于无法利用目前主流软件工具,在合理的时间内达到撷取、管理并整合成为能够帮助医院进行更积极目的经营决策的有用信息。规模巨大的临床实验数据、疾病诊断数据以及居民行为健康数据等汇聚在一起形成了医疗大数据。2.2医疗大数据的主要来源2.2.1制药企业、生命科学药物研发所产生的数据是相当密集的,对于中小型的企业也在百亿字节(TB)以上的。在生命科学领域,随着计算能力和基因测序能力逐步增加,美国哈弗医学院个人基因组项目负责人詹姆•鲍比就认为,到 2015 年,将会有 5000 万人拥有个人基因图谱,而一个基因组序列文件大小约为 750MB[3]。2.2.2临床医疗、实验室数据临床和实验室数据整合在一起,使得医疗机构面临的数据增长非常快,一张普通CT 图像含有大约 150MB 的数据,一个标准...