(一)数据孤岛问题大数据的基础在于数据,但是如果拿不到底层的数据,数据分析也就无从谈起
随着社交网络、移动互联网和物联网的兴起以及社交媒体的发展导致各种海量数据生成,带来了无限想象力和商业应用价值
“第一个问题就是没数据,理论上我们中国有很多数据,但实际做数据分析会发现非常困难
”中国科学院院士、北京大数据研究院院长鄂维南表示,数据孤岛是一个严重的问题,从技术层面看,大数据的主要挑战是采集和分析
不同部门的数据储存在不同地方,大数据来源众多、数量巨大、形式各异
大数据最高的层次就是用数据来形成智慧,这需要从中获得一目了然的信息做数据分析先要整合数据,整合数据需要真正高效、可靠的数据管理和分析平台
社会大数据是一种社会公共资源,由于政府部门之间、企业之间、政府和企业间信息不对称、制度法律不具体、缺乏公共平台和共享渠道等多重因素,还有多样的设备、各式各样的应用场景,导致大量政府数据存在“不愿公开、不敢公开、不能公开、不会公开”的问题,早就了一个个企业和政府管理部门的数据孤岛阻碍数据共享的另一个主要原因是缺乏动力和担心安全
贵阳大数据交易所执行总裁王叁寿透露,不少企业以保护商业机密或节省数据整理成本等为理由,不愿意交易自身数据
在出行领域,每天有上千万的出行记录和数百辆车的实时地理位置信息被记录在出行软件上
电商行业大量流转的货物,掌握着许多家庭住址
这些大数据涉及到千家万户的财产甚至人身安全,企业不愿意泄露这部分信息
部分政府部门也缺乏数据公开的动力:有的是因懒政而让数据沉睡,有的则是已经利用数据开展商业化应用,因此不愿共享
“数据孤岛的痛不是技术问题,是利益问题,背后隐藏的利益导致了数据孤岛的产生
”鄂维南坦言
对于如何打通数据孤岛,加快政府数据开放共享,政府要建立完善大数据发展协调机制,稳步推动公共数据资源开放,将大数据作为一项国家战略
大量的数据仍然掌握在个别企业和政府机