电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

浅谈医学大数据25

浅谈医学大数据25_第1页
1/44
浅谈医学大数据25_第2页
2/44
浅谈医学大数据25_第3页
3/44
下载后可任意编辑浅谈医学大数据陈遵秋和陈漪伊夫妇是美籍华人,现在美国定居。其二人是目前讨论医疗大数据及生物样本大数据真正的专家。现将两位的文章进行公开发表,与大家一起探讨。现在无论国内外均出现了移动医疗热,所有的创业团队和投资公司均把商业模式指向了最后的医疗大数据分析。但是可以很负责任的说,90% 以上的人都不知道医疗大数据分析是什么东西,因此这是一篇扫盲贴,但是仅供专业人士。文中分析了医疗大数据、它的维度、方法和成本,以及需要的专业人才。本文无论是对创业团队还是投资机构都是非常有指导意义的。大数据定义及其特征大数据顾名思义就是数量极其庞大的数据资料。从上世纪 80 年代开始,每隔 40 个月世界上储存的人均科技信息量就会翻倍 (Hibert & Lopez, 2024)。2024 年,每天会有 2.5EB 量的数据产生 (Andrew & Erik, 2024)。现在,2024 年,每天会有 2.3ZB 量的数据产生 (IBM, 2024)。这是一个什么概念? 现在一般我们电脑的硬盘大小都以 GB,或者 TB 为单位了。1GB 的容量可以储存约 5.4 亿的汉字,或者 170 张普通数码相机拍摄的高精度照片,或者 300-350 首长度为 5-6 分钟的 MP3 歌曲。 那 GB 和 TB, EB,ZB 的关系又是怎样?下载后可任意编辑1ZB=1024EB=10242PB=10243TB=10244GB。假如你有一台 1TB 硬盘容量的电脑,那 1ZB 就是大致等于 10 亿台电脑的容量, 远远超出了我们一般的想象。早期,IBM 定义了大数据的特性有 3 个:大量性( Volume), 多样性(Variety), 快速性(Velocity) (Zikopoulos, Eaton, deRooos, Deutsch, & Lapis, 2024)。后来又有学者把价值(Value)加到大数据的特性里。随着时间的推移和人们思考的进一步完善,又有三个大数据的特性被提出: 易变性(Variability),准确性 (Veracity) 和复杂性 (Complexity)。作者认为价值本质上是数据被分析后体现出来的有用信息知识的程度,和其他几个特性有根本区别。其他几个特性可以说是数据工作者具体实践中面临的挑战,而价值则是征服这些挑战后获得的回报。大数据的 6 个特性描述如下:大量性:一般在大数据里,单个文件大量性的级别至少为几十,几百 GB 以上,一调查 (Russom, 2024) 显示相当多的机构拥有的数据总量在 10 到 99TB 之间。用我们传统的数据库软件,1GB 已经可以储存千万条有着几百个变量的数据记录了。多样性:泛指数据类型及其来源的多...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

浅谈医学大数据25

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部