传统数据仓库分析大数据分析传统分析对已知的数据范畴中好理解的数据进行分析
大多数数据仓库都有一种精巧的提取、转换和加载(ETL)的流程和数据库限制,这意味着加载进数据仓库的数据是容易理解的,洗清过的,并符合业务的元数据
大数据最大的优点是针对传统手段捕获到的数据之外的非构造化数据
这意味着不能确保输入的数据是完整的,清洗过的和没有任何的错误
这使它更有挑战性,但同时它提供了在数据中获得更多的洞察力的范畴
传统分析是建立在关系数据模型之上的,主题之间的关系在系统内就已经被创立,而分析也在此基础上进行
在典型的世界里,很难在全部的信息间以一种正式的方式建立关系,因此非构造化以图片、视频、移动产生的信息、无线射频识别(RFID)等的形式存在,被考虑进大数据分析
绝大多数的大数据分析数据库基于纵列数据库之外
重要的 IT 公司对分析软件和应用系统供应商的购置已经成为一种日常现象
我们已经看到“大数据分析”这个词汇被使用在许多公司的解决方案中
“大数据”是用来表达大量的没有按照传统的有关格式存储在公司数据库中的非构造化数据的总术语
下列是大数据的普通特点
数据存储量相对于现在公司 TB(TERA BYTES)字节的存储限制,定义在PB(PETA BYTES)字节,EXA 字节以及更高的容量次序
普通它被认为是非构造化数据,并不适合公司已经习惯使用的关系型数据库之下数据的生成使用的是数据输入非传统的手段,像无线射频识别(RFID),传感器网络等
数据对时间敏感,且由数据的收集与有关的时区构成
在过去,专业术语“分析”应用于商业智能(BI)世界来提供工具和智能,通过对多个各样可能的信息视角的快速的、一致的、交互式访问获得洞察力
与分析的概念非常靠近,数据挖掘已经应用于公司以保持核心监测和海量信息的分析
最大的挑战就是如何通过大量的数据挖掘出全部的隐藏信息
传统数据仓库(DW)分析相对于大