—·《中国大数据技术/应用/售前 交流圈 QQ 群:322914180》·— 大数据的前世今生:大数据特征与发展历程 大数据(big data)是这样的数据集合:数据量增长速度极快,用常规的数据工具无法在一定的时间内进行采集、处理、存储和计算的数据集合。 大数据具有以下五大特征(4V+1O)的数据才称之为大数据,即: 数据量大(Volume)。第一个特征是数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000 个 T)、E(100 万个 T)或 Z(10 亿个 T)。 类型繁多(Variety)。第二个特征是种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。 价值密度低(Value)。第三个特征是数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过 强 大的机 器 算法来挖 掘 数据价值,是大数据时代 最 需 要解 决 的问 题 。 速度快时效 高(Velocity)。第四 个特征数据增长速度快,处理速度也快,时效 性 要求高。比 如搜 索 引 擎 要求几 分 钟 前的新 闻 能够 被 用户 查 询 到 ,个性 化推 荐 算法尽 可 能要求实 时完 成 推 荐 。这是大数据区 别 于 传 统 数据挖 掘 的显著 特征。 —·《中国大数据技术/应用/售前 交流圈 QQ 群:322914180》·— 数 据 是 在 线 的 ( Online) 。 数 据 是 永 远 在 线 的 , 是 随 时 能 调 用 和 计 算 的 ,这 是 大 数 据 区 别 于 传 统 数 据 最 大 的 特 征 。 现 在 我 们 所 谈 到 的 大 数 据 不 仅 仅 是大 , 更 重 要 的 是 数 据 变 的 在 线 了 , 这 是 互 联 网 高 速 发 展 背 景 下 的 特 点 。 比 如 ,对 于 打 车 工 具 , 客 户 的 数 据 和 出 租 司 机 数 据 都 是 实 时 在 线 的 , 这 样 的 数 据 才 有意 义 。 如 果 是 放 在 磁 盘 中 而 且 是 离 线 的 , 这 些 数 据 远 远 不 如 在 线 的 商 业 价 值大 。 关 于 大 数 据 特 征 方 面 , 特 别 要 强 调 的 一 点 是...