如何在大数据时代构建数据治理体系随着云计算、物联网、移动互联网等新一代信息技术的快速发展,人类产生的数据量呈指数级增长。据资料显示,2012 年,全球数据量达到 2.8ZB,预计到 2020 年,全球数据量将达到 40ZB。大数据蕴含着巨大的价值,如今众多企业已将数据视作企业的宝贵资产。然而,数据价值密度与数据总量成反比。面对巨大的数据规模,如何管理和利用数据,使其发挥价值是企业必须考虑的重要问题。大数据的价值所在使其面临着隐私和安全方面的威胁。大数据治理将组织的部门、流程、人等元素与数据的整个生命周期联系在了一起,对企业数据管理和数据资产价值有着至关重要的作用。《DGI 数据治理框架》一文将数据治理定义为“数据相关事务的决策和授权的执行”,并进一步解释为信息处理过程决策权和职责的策略,约定了由谁负责处理哪些信息,并在什么情况下采用哪种方法,以及何时来执行。首先,大数据治理是信息治理计划的一部分,这是其定位。这就要求组织在制订信息治理框架时,必须将大数据纳入其中,比如在信息治理委员会中增加数据科学家,在信息治理目标中增加大数据治理目标等。其次,大数据治理主要是数据处理的一系列相关政策的制订,这是其内涵。再次,必须优化大数据,这是大数据治理的重点。最后,大数据必须变现,这是大数据治理的目的所在。大数据体量大、种类繁多,且价值密度低,组织必须对其进行优化,比如定义元数据、净化大数据、实施数据生命周期管理等。看似没有任何价值的单一数据集合在一起时,会发现新的价值,这是大数据价值体现的重要途径之一。而大数据价值的体现往往会涉及数据的隐私,这就要求组织在进行大数据价值体现时,必须注重大数据的隐私处理。组织将数据视作其资产的一种,要将其转化成组织可以使用的现金,而变现的方式可以是单纯地出售数据本身,也可以是利用数据开发新业务。一、企业实施大数据治理的必要性1、企业实现数据资源在组织内部的共享和交换的需要目前,大部分工业企业已经完成了 ERP、CRM、供应链、协同办公等企业信息化系统的建设,但是由于数据分散在众多系统中,缺乏统一的数据定义和数据分类,因此在数据使用上存在数据不标准、数据不一致、数据完整性差等问题。数据不标准主要表现在不同系统之间描述同一业务实体的数据定义标准不同;数据不一致主要表现在相关联业务系统的数据不同步、各应用系统间存在数据编码规则不一致的问题,还有重复编码的问题;数据完整性差表现为...