大数据环境下的数据质量管理策略信息时代,数据已经慢慢成为一种资产,数据质量成为决定资产优劣的一个重要方面
随着大数据的发展,越来越丰富的数据给数据质量的提升带来了新的挑战和困难
提出一种数据质量策略,从建立数据质量评价体系、落实质量信息的采集分析与监控、建立持续改进的工作机制和完善元数据管理4个方面,多方位优化改进,最终形成一套完善的质量管理体系,为信息系统提供高质量的数据支持
1信息系统数据质量信息由数据构成,数据是信息的基础,数据已经成为一种重要资源
对于企业而言,进行市场情报调研、客户关系维护、财务报表展现、战略决策支持等,都需要信息系统进行数据的搜集、分析、知识发现,为决策者提供充足且准确的情报和资料
对于政府而言,进行社会管理和公共服务,影响面更为宽广和深远,政策和服务能否满足社会需要,是否高效地使用了公共资源,都需要数据提供支持和保障,因而对数据的需求显得更为迫切,对数据质量的要求也更为苛刻
作为信息系统的重要构成部分,数据质量问题是影响信息系统运行的关键因素,直接关系到信息系统建设的成败
根据"垃圾进,垃圾出(garbagein,garbageout)”的原理,为了使信息系统建设取得预期效果,达到数据决策的目标,就要求信息系统提供的数据是可靠的,能够准确反应客观事实
如果数据质量得不到保证,即使数据分析工具再先进,模型再合理,算法再优良,在充满“垃圾”的数据环境中也只能得到毫无意义的垃圾信息,系统运行的结果、作出的分析就可能是错误的,甚至影响到后续决策的制定和实行
高质量的数据来源于数据收集,是数据设计以及数据分析、评估、修正等环节的强力保证
因此,信息系统数据质量管理尤为重要,这就需要建立一个有效的数据质量管理体系,尽可能全面发现数据存在的问题并分析原因,以推动数据质量的持续改进
2大数据环境下数据质量管理面临的挑战随着三网融合、移动互联网、云计算、物联网的