第五章数据处理和可视化表达一、引言随着移动互联网和物联网的飞速发展,人类社会产生的数据以惊人的速度增长
如何高效地对这些数据进行采集、存储、处理,并从中发掘到有价值的信息,是大数据分析处理需要解决的问题
网络购物中,消费者购物行为的任何一个细节都被服务器记录着
通过大数据分析,商家可以了解消费者的偏好甚至预测其购买行为,如下图所示
大数据分析使得商家可以追踪用户的行为并确定最有效的方式以提升用户对购物平台的忠诚度,根据用户的个性化需求提供相应的产品或服务以获得更大的市场占有率
教学任务:认识大数据及其特征,认识大数据对人们日常生活的影响,了解数据采集、分析和可视化表达的基本方法
1认识大数据大数据是人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源大数据的产生是与人类日益普及的网络行为所伴生的:物联网、云计算、移动互联网、车联网、手机、电脑以及遍布地球各个角落的各种各样的传感器,无一不是数据的来源或是承载的方式
互联网生成的数据量,不仅远超此前一切人类所生成的数据量的总和,而且在以大爆发性的速度不断增长
大数据成为人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源
大数据的特征1、从互联网产生大数据的角度来看,大数据具有“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)
第一,数据体量巨大
从TB级别跃升到PB级别
第二,数据类型繁多
如网络日志、视频、地理位置信息等
第三,价值密度低
以视频为例,在连续不间断地监控过程中,有用的数据可能仅仅一两秒
第四,变化速度快
数据来自世界各地的网络终端,且以秒为单位快速变化
2、从互联网思维的角度来看,大数据具有三个特征:样本渐趋于总体,精确让位于模糊,相关性重于因果
第一,在大数据时代强调数据要全量而不是抽样
大数据时代有了更好的数据采集手段,