—·《中国大数据技术/应用/售前 交流圈 QQ 群:322914180》·— 大数据的前世今生:大数据特征与发展历程 大数据(big data)是这样的数据集合:数据量增长速度极快,用常规的数据工具无法在一定的时间内进行采集、处理、存储和计算的数据集合
大数据具有以下五大特征(4V+1O)的数据才称之为大数据,即: 数据量大(Volume)
第一个特征是数据量大,包括采集、存储和计算的量都非常大
大数据的起始计量单位至少是P(1000 个 T)、E(100 万个 T)或 Z(10 亿个 T)
类型繁多(Variety)
第二个特征是种类和来源多样化
包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求
价值密度低(Value)
第三个特征是数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵
随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过 强 大的机 器 算法来挖 掘 数据价值,是大数据时代 最 需 要解 决 的问 题
速度快时效 高(Velocity)
第四 个特征数据增长速度快,处理速度也快,时效 性 要求高
比 如搜 索 引 擎 要求几 分 钟 前的新 闻 能够 被 用户 查 询 到 ,个性 化推 荐 算法尽 可 能要求实 时完 成 推 荐
这是大数据区 别 于 传 统 数据挖 掘 的显著 特征
—·《中国大数据技术/应用/售前 交流圈 QQ 群:322914180》·— 数 据 是 在 线 的 ( Online)
数 据 是 永 远 在 线 的 , 是 随 时 能 调 用 和 计 算 的 ,这 是 大 数 据 区 别 于 传 统 数 据 最 大 的 特 征
现 在 我 们 所 谈 到 的 大 数 据 不 仅 仅