大数据思维与传统统计思维方式的差异分析_郑磊大数据思维与传统统计思维方式的差异分析_郑磊 当今信息科技高速进展, 大数据已经成为一种新的生产力, 驱动传统行业发生重大变革
由于大数据具有 4V(Volume, Variety, Velocity 和 Veracity) 特性 [1] , 传统统计思维方法已不能完全满足时代需求, 大数据思维方式亦应运而生
大数据思维与传统统计思维类似, 都是对现实世界的数据和现象进行科学分析和推断, 从而揭示事物的内在本质,推断其进展变化规律
然而, 由于这两种思维方式各有其自身特点, 其讨论重点和应用领域也各自不同, 所有我们就需要对这两种思维方式进行讨论, 从而开阔视野, 从多个角度以多种方法解决问题
1 大数据思维与传统统计思维方式的区别 1
1 讨论对象不同 总体性和样本性, 是大数据思维和传统统计思维讨论对象的根本区别
在传统统计思维中, 受传统分析方法的限制, 抽样分析是最常用的统计方法, 即按随机性原则, 从总体单位中随机抽取部分单位作为样本进行统计分析, 并以其结果推断总体有关指标的一种统计方法
实践证明: 抽样分析精确性受抽样随机性影响较大, 增加随机性, 精确度将大幅提高; 增加样本数量, 精确度影响不大, 因此样本选择的随机性比样本数量更为重要
用样本数据去推断全部样本的情况, 是传统统计方法分析数据的常用方法, 但在现实中, 这种方法可能无法展示事物的全貌, 其抽样的代表性有存在偏差的可能, 其推断的结果需要验证
在大数据背景下, 所有海量数据都可以存储在云存储上, 大数据思维不再采纳传统的随机抽样方式, 而是采纳“样本即总体” 的全数据思维方式, 采纳大数据特别算法,利用云计算强大的计算能力, 计算分析全部数据, 从而发现传统统计方法无法揭示的细节信息, 找出深藏在数据中不易被发现的秘密