北京市政务大数据平台顶层设计框架及应用方案本文摘自穆勇在中关村大数据产业联盟上所做的演讲。一、大数据在政务领域应用的概述说起大数据技术的应用,首先是在互联网行业起步并逐步拓展到电信、金融、工业等多个领域,产生了巨大的社会价值和产业空间,现正拓展到政务领域。(一)大数据技术在互联网行业的成功应用,那些地方是值得我们关注的第一,应该是思维观念和运作方式的变化,所谓的互联网思维,其核心理念包括:体外互动:邮件、电话、信件互动---服务导引服务外包:购买服务---简单服务让渡社会:众包---自助服务边界开放:数据开放---制造服务第二,是其技术演进,针对数据处理的技术首先是传统数据分析处理阶段,该阶段是面对结构化数据,非结构化处理效率低;硬件成本高;平台兼容性差。其次是基于云计算的大数据处理阶段,该阶段总体有了很大的改进和提升,主要体现在:具备结构化/非结构化混合分析的能力;基于消费级硬件,不依赖高性能、高可靠性硬件,从而保障系统性能和可靠性;平台兼容性好、扩展性高;进而业界又提出去 IOE 的思路。第三,是数据挖掘分析技术画像技术以及各类数据融合、分析、挖掘、预测等。这些都是政务领域需要学习与借鉴的。为此,我认为:大数据在政务领域应用即包括用新的思维、模式与技术来解决电子政务需求,也包括了政务大数据新的应用。对于第一个方面比较容易理解,对于第二个方面需要对政务大数据给出定义。有些人认为政府没有大数据,只有传统的小数据或中数据。这个问题我们将在下一节专门中进行讨论。政务领域是大数据应用崭新的领域,它将极大的改变政府的管理模式,有利于节约政府投资、提高政府决策能力、提升公共服务和社会管理能力,开展大数据在政务领域的应用是大势所趋,势在必行。同时,政务大数据本身也不同于其他领域或行业的数据,其复杂程度和需求的多样化比互联网行业大的多,也难的多。(二)政务大数据的定义及特点根据政府管理的数据来源和种类,可以分为下三类:第一类业务数据:业务办理过程中采集和产生的数据。第二类民意社情数据:对社会企业个人对象进行统计调查获得的数据。第三类环境数据:通过物理设备采集获得的气象、环境、影像等数据。在以前的电子政务建设阶段,政务信息资源开发利用更多的是集中在前两种类型和结构化数据上,而对第三类数据,特别是实时的、非结构化、半结构化数据的开发利用相对较少。随着政府业务在互联网、移动互联网、物联网等领域广泛...