大数据定义•大数据(bigdata),指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产引言:一场生活,工作与思维的大变革•大数据开启了一次重大的时代转型
就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发…
数据化意味着我们要从一切太阳底下的事物中汲取信息,甚至包括很多我们以前认为和“信息”根本搭不上边的事情
大数据时代的思维变革•01更多:不是随机样本,而是全体数据•当数据处理技术已经发生了翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样
一切都变了,我们需要的是所有的数据•“样本=总体”•02更杂:不是精确性,而是混杂性•执迷于精确性是信息缺乏时代和模拟时代的产物
只有5%的数据是结构化且能适用于传统数据库的
如果接受混乱,剩下95%的非结构化数据都无法被利用,只有接收不精确性;我们才能打开一扇从未涉足的世界的窗户
•03更好:不是因果关系,而是相关关系•知道“是什么”就够了,没必要知道“为什么”
在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”推动大数据发展的两个重要因素•人类测量,记录和分析世界的渴望•以传感技术、互联网、移动智能终端为代表的一系列新的信息技术,使得信息的获取、利用、集聚在数量上发生了突飞猛进的变化
中国的大数据—早期发展阶段•1、数据的丰富和开放程度不够•丰富的数据源是大数据产业发展的前提
而我国数字化的数据资源总量远远低于美欧,每年新增数据量仅为美国的7%,欧洲的12%,其中政府和制造业的数据资源积累远远落后于国外
就已有有限的数据资源来说,还存在标准化、准确性、完整性低,利用价值不