下载后可任意编辑浅谈医学大数据陈遵秋和陈漪伊夫妇是美籍华人,现在美国定居
其二人是目前讨论医疗大数据及生物样本大数据真正的专家
现将两位的文章进行公开发表,与大家一起探讨
现在无论国内外均出现了移动医疗热,所有的创业团队和投资公司均把商业模式指向了最后的医疗大数据分析
但是可以很负责任的说,90% 以上的人都不知道医疗大数据分析是什么东西,因此这是一篇扫盲贴,但是仅供专业人士
文中分析了医疗大数据、它的维度、方法和成本,以及需要的专业人才
本文无论是对创业团队还是投资机构都是非常有指导意义的
大数据定义及其特征大数据顾名思义就是数量极其庞大的数据资料
从上世纪 80 年代开始,每隔 40 个月世界上储存的人均科技信息量就会翻倍 (Hibert & Lopez, 2024)
2024 年,每天会有 2
5EB 量的数据产生 (Andrew & Erik, 2024)
现在,2024 年,每天会有 2
3ZB 量的数据产生 (IBM, 2024)
这是一个什么概念
现在一般我们电脑的硬盘大小都以 GB,或者 TB 为单位了
1GB 的容量可以储存约 5
4 亿的汉字,或者 170 张普通数码相机拍摄的高精度照片,或者 300-350 首长度为 5-6 分钟的 MP3 歌曲
那 GB 和 TB, EB,ZB 的关系又是怎样
下载后可任意编辑1ZB=1024EB=10242PB=10243TB=10244GB
假如你有一台 1TB 硬盘容量的电脑,那 1ZB 就是大致等于 10 亿台电脑的容量, 远远超出了我们一般的想象
早期,IBM 定义了大数据的特性有 3 个:大量性( Volume), 多样性(Variety), 快速性(Velocity) (Zikopoulos, Eaton, deRooos, Deutsch, & Lapis, 2024)
后来又有学者把价值(Val