文档编号:版 本 号: 数据采集需求说明书项目名称:文档信息编写者编写日期审核者审核日期批准人批准日期变更记录日期作者版本变更说明变更批阅日期批阅者意见一、引言1.编写目的这部分说明文档编写目的,描述本系统特点及使用数据仓库技术实现的业务目标。2.背景这部分是项目背景描述。3.参考资料这部分列出本文档引用资料的名称,并说明文档上下级关系。4.术语定义及说明这部分列出本文档中使用的术语定义、缩写及其全名。5.一般约束这部分描述本系统开发过程中的各种可预见的约束条件,例如工具性能约束、开发技术支持约束、软件范围约束等。二、数据源分析1.数据源概述这部分将对本项目中涉及的数据源名称及其业务功能作出简单描述,假如多个数据源之间有关联,那么需要说明他们之间的关联关系。2.数据源物理环境描述(1)硬件平台这部分记录所有数据源程序运行环境需要的硬件平台,包括:每一个数据源所在的硬件平台环境数据源服务器所在的硬件平台环境数据仓库服务器的硬件平台环境数据源程序运行监控硬件平台环境这里的硬件环境包括机器的型号、硬盘的容量及其速度以及网络环境等.(2)软件平台这部分内容是记录所有与数据源程序相关的软件平台,包括:每一个数据源所在的软件平台环境数据源服务器所在的软件平台环境数据仓库服务器的软件平台环境数据源程序运行监控软件平台环境这里的软件环境包括操作系统的种类和版本、数据库的种类和版本等,对监控平台还要关注应用软件。(3)网络平台这部分记录与数据采集程序有关的所有网络环境的定义。3.数据源数据更新特征这部分对每一个数据源中本次项目中涉及的主表的数据更新状态进行分析,例如是日更新还是月更新以及更新的标志,以作为以后编写增量采集程序的基础.4.数据源可以提供的文件格式这部分对本项目中涉及的数据源可以提供的数据格式进行记录,供确认采集需求使用。三、数据仓库环境分析1.数据仓库数据量预估这部分评估本次项目中所有与数据量有关的参数,包括数据源历史数据量、数据源日增量、数据仓库历史存储时间,并根据这些参数估算本次项目中需要向数据仓库增加的数据量。2.数据仓库粒度定义这部分根据业务需求和数据源数据分析确定本次项目中涉及的业务实体的粒度。这里讨论这个问题,是因为粒度的高低关系到数据采集的难度。3.数据仓库运行环境描述(1)硬件平台这部分记录所有数据源程序运行环境需要的硬件平台,包括:每一个数据源所在的硬件平...