《大数据时代》读书报告 《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,被公认为是国内外大数据讨论的先河之作。作者通过枚举了上百个例子,对大数据的方方面面进行了系统详细解说,让每一名读者,即使是外行也能很容易理解,直观感受到大数据给社会和生活带来的改变。 在本书中,对于大数据时代,作者主要提出了三个核心观点: 1、要全体不要抽样。分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。2、要效率不要绝对精确。我们乐于接受数据的纷繁复杂,而不再追求精确性。3、要相关不要因果。我们不再探求难以捉摸的因果关系,转而关注事物的相关关系。 这三个观点在某种程度上颠覆了我们的传统思想。 要全体不要抽样: 传统的统计学方法是解决如何通过选取少量样本,通过对样本的分析,然后推断整体的趋势和规律。而大数据时代告诉我们“样本=全体”,在很多时候,我们不再需要费心去考虑样本抽样、数据过滤等问题。我们利用大量数据,甚至是所有数据,然后用算法去计算分析,从而更精准的找到各个因素之间的相关关系(不是因果关系),以发现数据之间的规律。 要效率不要绝对精确: 在传统的统计学中,由于抽样的限制,讨论往往会对精确度做很严格的要求,譬如置信区间的概念。而大数据时代会把这些条件放的更宽松。我们要学会在精度和效率之前做取舍,要能够容忍错误,学会在瞬息万变的信息中掌握趋势,为下一刻的决策提供依据,这就够了。正如作者所说:“接受数据的不精确和不完美,我们反而能够更好地进行预测,也能够更好地理解这个世界。” 要相关不要因果: 这个观点也区别于我们传统的教育理念。我们习惯于“打破砂锅问到底”、“举一反三”式的教育方式。当我们找到了自以为是的答案时,其实可能只是冰山一角,探究事物背后本质的动机不能停止。但大数据时代告诉我们要放弃对因果关系的渴求,取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。 上述作者提出的三个观点对于大数据的进展具有深远的指导意义。我也深信这三个观点在未来也将长久地改变着我们的社会和生活。对于大数据,接下来我也想谈一谈个人的理解和认识。 大数据时代,统计学依旧是数据分析的灵魂。大数据时代提出的观点是“样本=全体”,因此,有一部分人甚至抛出了大数据时代统计无用的观点。他们认为数据中包含了所有的意义,只要计算能力足够强大,就不需要什么理论。但是他们似乎忘了,数据≠信息。一...