WORD 格式 专业资料整理 1. 信息资源标准化 数据标准化主要实现了数据格式、 内容和语义的映射、转换,实现编码一致 化、面向主题集成、数据聚合等功能。 通过数据交换、采集,形成的基础业务数据,通过数据整合进一步的数据 ETL(数据抽取、转换、加载),按照定制的标准信息规范进行匹配映射(Match)、 数据格式转换(Transform),并对重复数据进行数据清洗( Cleanse)、过滤 (Filtrate)、聚合(Aggregate ),最后多维加载(Load)后形成标准化数据。 采用数据同步工具和 ETL 工具完成数据抽取、同步等整合工作,并通过任 务调度管理实现对整合工具的集中管理和执行。 数据采集时可以按信息资源平台的要求将数据标准化。 在采集抽取数据时没 有按信息资源平台转换为标准数据的数据, 需要按信息资源平台的要求转换成标 准的数据如字典的统一。 2. 数据加工管理 2.1. 数据抽取 数据抽取是利用抽取工具,建立抽取模型,将多个数据源数据汇总到一个数 据库的过程。 2.2. 数据清洗 由于数据来自多个业务系统,而且包含历史数据,需要按照一定的规划把数 据进行清洗,整个数据清洗的对象应包括不完整的数据、 错误的数据、重复的数 据等三大类。 WORD 格 式 专 业 资 料 整 理 2.3. 数 据 转 换 数 据 转 换 主 要 实 现 数 据 标 准 化 的 过 程 , 信 息 资 源 平 台 的 数 据 , 来 自 多 个 业 务 系 统 , 有 些 数 据 源 没 有 按 照 统 一 的 标 准 规 范 设 计 , 因 此 会 造 成 数 据 难 以 与 其 他 数 据 共 享 。 数 据 转 换 应 实 现 按 照 统 一 的 数 据 标 准 和 既 定 的 格 式 转 换 规 则 , 对 数 据 的 整 理 和 格 式 统 一 。 2.4. 数 据 装 载 数 据 装 载 操 作 效 率 是 数 据 资 源 平 台 需 要 考 虑 的 重 要 环 节 。 投 标 人 应 详 细 描 述 针 对 本 项 目 的 不 同 数 据 资 源 所 应 采 用 的 数 据 装 载 策 略 。 2.5. 数 据 标 识 数 据 标 识 主 要 为 了 突 出 数 据 的 关 键 性 信 息 , 便 于 实 时 的 统 计 和 更 有 效 的 比 对 , 进 而 获 取 符 合 用 户 业 务 办 理 相 关 的 结 果 。 3....