大数据环境下的审计信息化(思路篇)前言:审计信息化工作十余年,面临着云计算、物联网、大数据、移动通讯和社交网络等新技术的挑战
本文希望通过对大数据的理解、审计中的应用分析,提出大数据服务与审计的一个角度或方向,进而形成相关信息化配套建设的思路
本文的编写希望得到读者的回馈,能够收到您的批评、指正
一、大数据的定义和理解(一)广泛定义对于大数据的理解现在并没有一个标准的定义,不过大家对于大数据都有一个共同的认识,那就是 4V(Volume、Velocity、Variety、Veracity):1
(Volume)数据量大,TB,PB,乃至 EB 等数据量的数据需要分析处理
(Velocity)要求快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求,所以数据量显得对速度要求有些“大”
3•(Variety)数据多样性:不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作,变为结构数据
(Veracity)价值密度低,由于数据采集的不及时,数据样本不全面,数据可能不连续等等,数据可能会失真,但当数据量达到一定规模,可以通过更多的数据达到更真实全面的反馈
而简化一下描述,其实“大数据”是一个体量特别大,数据类别特别多的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理
(二)审计的大数据特征从“大数据”概念产生的缘由来看审计行业是一个天然需要大数据概念及其实现技术的行业
我们分析如下:首先,审计行业的“生产对象”是被审计对象的数据,虽然说审计是对财政财务收支的监督
但是为了了解财务的真实情况,必然需要关注业务数据,这些行业的数据每一个都可以说是数据体量巨大
同时这些数据也是复杂多样的,结构化数据不用说了(二维表数据、立方体数据、空间数据等),非结构化数据例如:被审计单位的各种制度、文件、影像等