《大数据时代》读书报告题记:这是信息学院信息1102班吕静同学阅读《大数据时代》的体会,有兴趣的同学可以关注一下。进入2013年,大数据被越来越多地提及,它已经上过《纽约时报》、《华尔街日报》的专栏封面,进入美国白宫网的新闻,并频繁出现在互联网、移动互联网、电商、电信、金融等领域的大佬们的话语中,不管是阿里巴巴的前CEO马云,还是腾讯的董事长马化腾,都在谈论着大数据。亚马逊、沃尔玛、雅虎、IBM、苹果、谷歌这些国际巨头更是在很早的时候,就开始在大数据方面进行研究和布局。于是鄙人也跟随潮流,通过网上的相关资料对大数据做了一定了解,同时,又花一个星期的时间拜读了维克托·迈尔-舍恩伯格的《大数据时代》,深受裨益,特此将感悟心得记下,与各位同学分享。本文通篇分为三部分,第一部分是全书概述,主要包括作者简介、内容概要,让大家对《大数据时代》一书有一初步的了解;第二部分是感悟思考,主要包括大数据在开放平台、社交网络、电子商务领域的应用分析;第三部分是过程体会,主要是对读书过程及方法的一种分享,希望与大家有所交流互益。一、全书概述本书作者维克托·迈尔-舍恩伯格被誉为“大数据时代的预言家”,现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,新加坡国立大学信息政策研究中心主任,他的咨询客户包括微软、IBM和惠普等全球顶级企业。《经济学人》说,在大数据领域,他是最受人尊敬的权威发言人之一;《科学》说,若要发起一场关于这个问题的深入讨论,没有比他更好的发起者了。他是欧盟互联网官方政策背后的重要制定者和参与者;他是最早洞见大数据时代发展趋势的数据科学家之一。而本书的译者,现年30岁的周涛则是电子科技大学互联网科学中心主任、教师、博士生导师,发表了SCI论文150余篇,领域一流期刊90余篇。整本书分为三个部分,分别是大数据时代的思维变革、商业变革和管理变革。大数据时代的思维变革分为“不是随机样本,而是全体数据”、“不是精确性,而是混杂性”、“不是因果关系,而是相关关系”三部分,分别讲述了大数据时代,数据在数量、性质和关系方面的变革。当数据处理技术得到了较大的发展之后,数据分析就采取了全数据模式,样本=总体,比如淘宝进行用户行为分析时会就一个用户在淘宝里的所有行为进行技术分析,而谷歌对流感的预测则是对所有相关词汇搜索行为进行技术分析。书里说,只有5%的数据是结构化且能适用于数据库的,如果不接收混乱,剩下的95%的非结构化数据都无法被利用。用户在互联网上的行为,其实就是一种数据,比如鼠标停留位置、搜索输入语言、项目点击次数等,但是这些数据其实都不是标准化、结构化的,用户搜索板蓝根、感冒灵、吃什么水果治感冒等都说明用户可能感冒了,但是其输入的搜索文字确实不一样的,如果要精准地按照感冒两个字来判断用户是否感冒,其数据分析结果和实际结果应该会存在比较大的差距。淘宝数据有一个视频内容是各个省份的人购物情况的分析统计,比如在见不到大海的新疆,购买比基尼却是最多的,那么淘宝并不需要知道新疆人为什么喜欢买比基尼,是因为气候还是生活习惯并不重要,重要的是淘宝要多为新疆用户推荐比基尼,可以获得更高的转化率。(推荐视频《淘宝数据盛典——你所不知道的城市秘密》优酷视频播放:http://v.youku.com/v_show/id_XMzU2NzM2MDk2.html)大数据时代的商业变革分为内容数据化、数据价值实现、数据公司类型三部分,随着信息技术的变革,我们将文字、方位、沟通甚至是世间万物都变成数据,然后通过数据的再利用、重组、扩展等实现价值,创造大数据公司。同时,根据所提供价值的数据本身、技能和思维三种不同来源,分别出现了基于这三种来源的互联网公司,而谷歌、亚马逊等则是包含三者,全面发展的大数据公司。大数据时代的管理变革则分为大数据的风险和自由度掌控。大数据带来的风险主要包括个人生活的监视、隐私的泄露、预测惩罚以及数据独裁,对此,通过一定的管理变革,比如个人隐私保护从个人许可到让数据使用者承担责任,预测分析并不决定个人动因及相应惩罚,避免数据独裁而培养大数据算法师...