1.信息资源原则化数据原则化重要实现了数据格式、内容和语义的映射、转换,实现编码一致化、面对主题集成、数据聚合等功效。通过数据交换、采集,形成的基础业务数据,通过数据整合进一步的数据ETL(数据抽取、转换、加载),按照定制的原则信息规范进行匹配映射(Match)、数据格式转换(Transform),并对重复数据进行数据清洗(Cleanse)、过滤(Filtrate)、聚合(Aggregate),最后多维加载(Load)后形成原则化数据。采用数据同时工具和ETL工具完毕数据抽取、同时等整合工作,并通过任务调度管理实现对整合工具的集中管理和执行。数据采集时能够按信息资源平台的规定将数据原则化。在采集抽取数据时没有按信息资源平台转换为原则数据的数据,需要按信息资源平台的规定转换成原则的数据如字典的统一。2.数据加工管理2.1.数据抽取数据抽取是运用抽取工具,建立抽取模型,将多个数据源数据汇总到一种数据库的过程。2.2.数据清洗由于数据来自多个业务系统,并且包含历史数据,需要按照一定的规划把数据进行清洗,整个数据清洗的对象应涉及不完整的数据、错误的数据、重复的数据等三大类。2.3.数据转换数据转换重要实现数据原则化的过程,信息资源平台的数据,来自多个业务系统,有些数据源没有按照统一的原则规范设计,因此会造成数据难以与其它数据共享。数据转换应实现按照统一的数据原则和既定的格式转换规则,对数据的整顿和格式统一。2.4.数据装载数据装载操作效率是数据资源平台需要考虑的重要环节。投标人应具体描述针对本项目的不同数据资源所应采用的数据装载方略。2.5.数据标记数据标记重要为了突出数据的核心性信息,便于实时的统计和更有效的比对,进而获取符合顾客业务办理有关的成果。3.数据整合解决系统3.1.数据解决流程数据中心的构建,基础和核心的工作是需要对来自各方的数据进行充足的整合和解决,对获取的各类源数据,需要进行大量的数据梳理、分析,并作有关的数据整顿工作,通过数据梳理和转换工作,把不同来源的数据基于数据原则,转换成原则化数据后,再进行入库,从而确保进入数据中心的数据质量,不产生垃圾数据,从而为数据中心的全局应用奠定基础。数据解决的流程以下图所示:数据的解决流程重要以下:1、获取源数据通过数据共享交换对接和实施,获取各单位的原始数据,并暂存在数据缓冲库中,这部分的数据构造和原始数据的数据构造相似。2、数据整合解决对缓冲库中存储的数据,基于数据原则,对原始的数据进行整合解决,涉及公司核心码原则化解决、公司基础数据整合解决、公司许可数据整合解决、公司监管数据整合解决、其它政府部门数据整合解决、电子统计报表数据导入解决、历史数据整合解决等。通过整合解决,把非原则化的原始数据转换成原则化的数据。3、数据中心数据入库对整合解决后的数据按照数据的性质,分别进入到基础数据库和业务数据库中。3.2.食品安全监管数据整合解决分析3.2.1.公司核心码原则化解决现在,有关公司的各类信息都分散在XX省XX监管平台、网上办事大厅XX分厅以及有关部门的行政审批系统,不同的系统对公司的唯一编码各不相似,现在存在三种方式:公司组织机构代码公司工商登记注册号统一社会信用代码公司XX行业有关许可证号由于不同的业务系统是由不同的开发商开发的,在公司编码的标记上各不统一的,为了实现基于公司为根本,首先需要以公司核心码为关联,对各方汇聚的有关公司的各类信息进行关联整合,形成公司综合资源,为后续的公司综合分析提供数据支撑。因此,需要基于公司编码原则,对采集的原始公司业务数据的公司编码进行原则化解决。公司核心码原则化解决涉及的工作涉及:1、基础数据获取通过共享交换对接、文献导入等多个方式,获取有关公司的基础数据等。2、公司核心码梳理分析根据调研状况,针对XX市公司基础数据的实际状况和国家推行三码合一的政策,采用依次以信用代码、组织机构代码、工商登记注册号、许可证号对从各方获取的公司信息进行梳理分析,和公司核心码进行比对,制订公司核心码原则化的解决规则。3、公司核心码数据原则化对各方汇聚的公司核心码数据按照原则化解决规则进行转换、补充等...