大数据技术词汇表 Anomaly: 见 异 常 值 词 条 。 Apache Software Foundation( ASF): 专 门 为 支 持 开 源 软 件 项 目 而 办 的 一 个 非 盈 利 性 组 织 。 ARPU( Average revenue per user): 每 个 用 户 的 平 均 收 入 。 Artificial neural network:人 工 神 经 网 络 , 通 常 简 称 神 经 网 络 。 Avro: 一 个 在 Hadoop上 的 数 据 序 列 化 系 统 , 设 计 用 于 支 持 大 批 量 数 据 交 换 应 用 。 宝 贝 : 淘 宝 和 天 猫 网 上 商 城 对 于 网 店 商 品 的 专 门 用 语 。 贝 叶 斯 分 析 方 法 ( Bayesian Analysis): 提 供 了 一 种 计 算 假 设 概 率 的 方 法 , 这 种 方 法 是 基 于假 设 的 先 验 概 率 、 给 定 假 设 下 观 察 到 不 同 数 据 的 概 率 以 及 观 察 到 的 数 据 本 身 而 得 出 的 。 bounce rate: 见 跳 出 率 词 条 。 B2C: 英 文 Business-to-Consumer 的 缩 写 , 其 中 文 含 义 为 企 业 对 消 费 者 。 CART: Classification and Regression Trees的 英 文 首 字母缩 写 , 或者 称 分 类与回归树,是 一 种 决策树分 类算 法 。 CBL( China Black List): 中 国垃圾邮件 黑名单。 Cluster( 类或簇的 英 文 ): 是 一 个 数 据 对 象的 集合。 Cookie: 指的 是 指网 站为 了 辨别用 户 身 份而 储存在 用 户 本 地终端浏览器上 的 一 类数 据 。 CRM( 用 户 关系 管理, Customer Relationship Management) 指的 是 公司对 客户 和 潜在 客户的 管理模式。 Direct Marketing: 见 直效行销词 条 。 Discriminant analysis: 见 判别分 析 词 条 。 DSS(Decision Support System): 决策支 持 系 统 的 缩 写 , 是 辅助决策者 通 过数 据 、 模型和 知识, 进行半结构化 或非 结构化 决策的 计 算 机应 用 系 统 。 独立访客: 指在 一 天 之内( 00:00-24:00) 访问网 站的 上 网 电脑数 量 ( 以 cookie为 依据 )。 EB: 计 算 机存储单位, 1 EB = 1,024 PB = 1,048,576...