在检察工作中大数据的运用及风险防范近年来,在社会生活、商业发展、科技创新的方方面面互联网应用都起到了不可忽视的作用。互联网的高速发展催生了社会经济发展的新形态。20XX年7月4日,国务院印发《关于积极推进互联网+行动的指导意见》,政府大力推动现代互联网与传统行业结合,加速产业发展,增强行业创新能力。由此可以预见的是,计算机网络应用所产生的数据将会呈现爆发式增长,大数据正在逐步走进我们的日常工作生活中。一、大数据的内涵及其之于检察工作的意义(一)大数据的内涵什么是大数据。麦肯锡全球研究所给出的定义是。一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低的四大特征。这其中就提到了大数据的四大特征,通常用4个v(即volume、variety、velocity、value)来表示。数据量大(volume)是指大数据的体量一般要达到pb级(千万亿字节)。以目前检察工作中最经常用到的全国统一业务应用系统来分析,高检院的数据体量能够达到pb级,但是单以一个省份的数据体量来算可能还难以达到pb级,那是不是说检察工作中的大数据仅仅在全国层面存在呢。其实并不能单单以数据体量来衡量是否是大数据,还应当结合大数据的其他几个特征来多维度进行分析。同时大数据的分析不能简单地以应用系统为单位割裂开来,检察业务的各个应用系统都是有关联的,要仔细分析各个业务的内在结合点,统筹分析计算。以高检院目前正在大力建设的电子检务工程来看,以后检察工作中将会出现更多的业务系统、平台系统,这些系统加在一起的数据体量也许就不是我们现在能够想像的了。数据种类多(variety)是指大数据可以表现为数字、文本、视频、音频、图片等多种形式,既包括结构化数据(数字、符号等),也包括非结构化数据(文本、音视频等)和半结构化数据。在日常的检察工作中既有案件案卡数字,还有大量案件第1页共8页卷宗文本、案件相关视频等,所以检察工作的特性决定了其数据种类繁多,需要以大数据的思维去分析运用。数据流转高速(velocity)是指大数据要求实时分析,对于数据的时效性要求比较高。如果数据收集或是分析的黄金时间错过了,可能这些数据就没有意义了,其分析价值自然也大打折扣,这其中最典型的就是职务犯罪侦查中的相关数据分析。所以检察大数据工作也对检察业务系统的数据收集和数据分析能力提出了更高的要求。数据价值密度低(value)是大数据最重要的特性。数据本身是没有价值的、独立的数据也不会有多大的价值。但是把大量数据聚合在一起进行分析挖掘,就可能提炼出新的价值信息,对过去经验进行提炼、对当前形势进行判断、对未来趋势进行预测。这必然就要求有海量的数据作为分析挖掘的基础,在海量数据中找到真正有价值的数据,去除大量的干扰数据和无用数据,通过价值关联点提炼出相应的规律。(二)大数据对于检察工作的意义1.大数据是检察信息化发展的必然要求随着全国电子检务工程的全力推进,六大平台建设逐步完成,当前的检察事业发展已经离不开信息技术的发展。在国家建设网络强国的战略思想指导下,在互联网+思维的引领下,大数据将是今后检察信息化发展的重中之重。脱离了大数据的检察信息化,必然是一条腿走路,无法实现检察事业的可持续性发展、健康发展。2.大数据是智慧检务的发展基础智慧检务的关键是智慧,而智慧产生的基础就在于数据。互联网+时代的核心要素就是数据,海量的数据。检察机关如果没有大数据作为支撑,就谈不上智慧检务了。只有广泛采集、积累司法办案数据、管理数据、互联网数据,智能融合各类数据集合,科学分析数据关联,才能让检察工作产生智慧。通过以深度学习为代表的机器学习算法的逐步应用,使检察大数据和人工智能深度结合,真正让检务智能成为现实。3.大数据是检察工作创新的知识源泉信息技术的高速发展使得技术成为了当前各行业创新发展第2页共8页的驱动力量。检察机关的不断拓展创新必然离不开互联网技术,充分运用信息网络技术,提升司法管理效能、拓宽司法公开广度、提高司法办案能力。检察机关应当顺应互联...