医 疗 健 康 大 数 据 : 应 用 实 例 与系统分析 1 、概述 随着信息技术和物联网技术的发展、个人电脑和智能手机的普及以及社交网络的兴起,人类活动产生的数据正以惊人的速度增长
根据国际数据公司(International DataCorporation,IDC)的报告,仅2011 年,全世界产生的数据就有1
8 ZB(1 ZB≈1 021 byte),并且平均每 5 年增长9 倍[1]
大数据一词由此而生
大数据是指难以被传统数据管理系统有效且经济地存储、管理、处理的复杂数据集
大数据一般以PB 为单位计量,并包含结构化、半结构化、无结构化的数据,大数据给数据的采集、运输、加密、存储、分析和可视化带来了严峻的挑战[2]
与传统数据相比,大数据包含 5个V 特性:Volume(数据规模巨大)、Variety(数据类型繁多)、Velocity(数据产生的数据非常快)、Veracity(分析结果取决于数据准确性)、Value(大数据一般包含非常重要的价值)[3]
大数据带来了存储、管理、处理数据的挑战,也带来了发掘数据中新的价值的机遇
多个行业已经利用大数据改 善 业务 ,例 如 金 融 业、零 售 业、生命 科 学 、环 境 研 究
大数据市 场 估 计每年会 增长50 亿 美 元 的价值,到 2020 年将 达 到 600 亿 美 元 的价值[4]
医 疗 健 康 行业目 前 面 临 着巨大的挑战,其 中,最 主 要的挑战包括 :急 剧 升 高 的医 疗 支 出 、人口 老 龄 化带来的慢 性疾 病 问 题 、医 疗 人员 短 缺 、医 疗 欺 诈 [5]等
国家 统计局 的数据显 示 ,我 国2013 年医 疗 卫 生总 支 出 为 31 668 亿 元 ,较 2012 年上 升 12
6%,并且已经连 续 8 年每年增长超 过 10%
医 疗 支 出 已