大数据就是当前很热得一个词
这几年来,云计算、继而大数据,成了整个社会得热点,不管什么,都要带上“大数据"三个字才显得时髦
大数据究竟就是什么东西
有哪些相关技术
对普通人得生活会有怎样得影响
我们来一步步弄清这些问题
一、基本概念在讲什么就是大数据之前,我们首先需要厘清几个基本概念
1、数据关于数据得定义,大概没有一个权威版本
为方便,此处使用一个简单得工作定义:数据就是可以猎取与存储得信息
直观而言,表达某种客观事实得数值就是最容易被人们识别得数据(因为那就是“数”)
但实际上,人类得一切语言文字、图形图画、音像记录,所有感官可以察觉得事物,只要能被记下来,能够查询到,就都就是数据(data).不过数值就是所有数据中最容易被处理得一种,许多与数据相关得概念,例如下面得数据可视化与数据分析,最早就是立足于数值数据得
传统意义上得数据一词,尤其就是相对于今日得“大数据”得“小数据”,主要指得就就是数值数据,甚至在很多情况下专指统计数值数据
这些数值数据用来描述某种客观事物得属性
2、数据可视化对应英语得d ata visu l izat i o n(或可译为数据展示),指通过图表将若干数字以直观得方式呈现给读者
比如非常常见得饼图、柱状图、走势图、热点图、K 线等等,目前以二维展示为主,不过越来越多得三维图像与动态图也被用来展示数据
3、数据分析这一概念狭义上,指统计分析,即通过统计学手段,从数据中精炼对现实得描述.例如:针对以关系型数据库中以 t a ble 形式存储得数据,根据某些指定得列进行分组,然后计算不同组得均值、方差、分布等
再以可视化得方式讲这些计算结果呈现出来
目前很多文章中提及得数据分析,其实就是包括数据可视化得
4、数据挖掘这个概念得定义也就是众说纷纭,落到实际,主要就是在传统统计学得基础上,结合机器学习得算法,对数据进行更深层次得分析,并从中猎取一些传