大数据职业发展方向一、大数据的概念及特点:大数据本身就是一个很抽象的概念,提及大数据很多人也只能从数据量上去感知大数据的规模,大数据被定义为“代表着人类认知过程的进步,数据集的规模是无法在可容忍的时间内用目前的技术、方法和理论去获取、管理、处理的数据
大数据不是一种新技术,也不是一种新产品,而是一种新现象,是近来研究的一个技术热点
大数据具有以下4个特点,即4个“V”:(1)数据体量(Volumes)巨大
大型数据集,从TB级别,跃升到PB级别
(2)数据类别(Variety)繁多
数据来自多种数据源,数据种类和格式冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据
(3)价值(Value)密度低
以视频为例,连续不间断监控过程中,可能有用的数据仅仅一两秒钟
(4)处理速度(Velocity)快
包含大量在线或实时数据分析处理的需求,1秒定律
最后这一点也是和传统的数据挖掘技术有着本质的不同
物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式
二、大数据处理流程:从大数据的特征和产生领域来看,大数据的来源相当广泛,由此产生的数据类型和应用处理方法千差万别
但是总的来说,大数据的基本处理流程大都是一致的
整个处理流程可以概括为四步,分别是采集、导入和预处理、统计和分析,最后是数据挖掘
三、大数据分解结构:第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线
我会从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈
第二层面是技术,技术是大数据价值体现的手段和前进的基石
我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来