常用大数据词汇中英文对照表 A 聚合(Aggregation) – 搜索、合并、显示数据的过程 算法(Algorithms) – 可以完成某种数据分析的数学公式 分析法(Analytics) – 用于发现数据的内在涵义 异常检测(Anomaly detection) – 在数据集中搜索与预期模式或行为不匹配的数据项。除了“Anomalies”,用来表示异常的词有以下几种:outliers, exceptions, surprises, contaminants.他们通常可提供关键的可执行信息 匿名化(Anonymization) – 使数据匿名,即移除所有与个人隐私相关的数据 应用(Application) – 实现某种特定功能的计算机软件 人工智能(Artificial Intelligence) – 研发智能机器和智能软件,这些智能设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学习 B 行为分析法(Behavioural Analytics) – 这种分析法是根据用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式 大数据科学家(Big Data Scientist) – 能够设计大数据算法使得大数据变得有用的人 大数据创业公司(Big data startup) – 指研发最 新 大数据技 术 的新 兴 公司 生 物测定术 (Biometrics) – 根据个人的特征 进 行身 份 识 别 B 字 节 (BB: Brontobytes) – 约 等 于 1000 YB(Yottabytes),相当 于未 来数字 化宇 宙 的大小 。1 B 字 节 包含 了 27 个 0! 商 业智能(Business Intelligence) – 是一系 列 理 论、方 法学和过程,使得数据更 容 易 被 理 解 C 分类 分析(Classification analysis) – 从 数据中获 得重 要的相关性信息的系 统 化过程; 这类 数据也 被 称 为元 数据(meta data),是描 述 数据的数据 云 计算(Cloud computing) – 构 建 在网 络 上 的分布 式计算系 统 ,数据是存 储 于机房 外 的(即云 端 ) 聚类 分析(Clustering analysis) – 它是将 相似 的对象 聚合在一起 ,每 类 相似 的对象 组 合成一个聚类 (也 叫作簇 )的过程。这种分析方 法的目 的在于分析数据间的差 异和相似 性 冷 数据存 储 (Cold data storage) – 在低 功耗 服 务 器上 存 储 那 些几乎 不被 使用的旧 数据。但 这些数据检索起 来将 会 很 耗 时 对比 分析(Comparative analy...