数据采集需求说明书项目名称:《数据采集需求说明书》文档信息变更记录变更审阅《数据采集需求说明书》《数据采集需求说明书》•每一个数据源所在的软件平台环境•数据源服务器所在的软件平台环境•数据仓库服务器的软件平台环境•数据源程序运行监控软件平台环境这里的软件环境包括操作系统的种类和版本、数据库的种类和版本等,对监控平台还要关注应用软件
(3)网络平台这部分记录与数据采集程序有关的所有网络环境的定义
3.数据源数据更新特征这部分对每一个数据源中本次项目中涉及的主表的数据更新状态进行分析,例如是日更新还是月更新以及更新的标志,以作为以后编写增量采集程序的基础
4.数据源可以提供的文件格式这部分对本项目中涉及的数据源可以提供的数据格式进行记录,供确认采集需求使用
三、数据仓库环境分析1.数据仓库数据量预估这部分评估本次项目中所有与数据量有关的参数,包括数据源历史数据量、数据源日增量、数据仓库历史存储时间,并根据这些参数估算本次项目中需要向数据仓库增加的数据量
2.数据仓库粒度定义这部分根据业务需求和数据源数据分析确定本次项目中涉及的业务实体的粒度
这里讨论这个问题,是因为粒度的高低关系到数据采集的难度
《数据采集需求说明书》3.数据仓库运行环境描述(1)硬件平台这部分记录所有数据源程序运行环境需要的硬件平台,包括:•每一个数据源所在的硬件平台环境•数据源服务器所在的硬件平台环境•数据仓库服务器的硬件平台环境•数据源程序运行监控硬件平台环境这里的硬件环境包括机器的型号、硬盘的容量及其速度以及网络环境等
(2)软件平台这部分记录所有与数据源程序相关的软件平台,包括:•每一个数据源所在的软件平台环境•数据源服务器所在的软件平台环境•数据仓库服务器的软件平台环境•数据源程序运行监控软件平台环境这里的软件环境包括操作系统的种类和版本、数据库的种类和版本等,对监控平台还要关注应用软件