读大数据时代心得体会首先,本书大体上都是在讲美国政府在各社会团体不断争取权利、三权分立制度的制衡下,一步步将信息公然的历程
和数据对美国政治所产生的影响,美国政府如何保护公民隐私等等
实在真正触及到企业如何变得更加智能,惟有第四章讲得非常具体
先来看一下完全的商务智能流程:1、通过各种来源的关系型数据库,使用elt(提取、转换、加载)工具,对来自不同系统的数据以同一格式进行清洗、转换、集成进进到数据仓库
2、锁定目标数据落后行联机分析
通过不同的分析角度进行***分析,这样用户可以随时创建自己需要的报表,开发职员只要在后台为用户创建构建***的数据立方体模型,用户就能够直接在前真个各个维度之间进行切换,从不同的维度对数据进行分析
从而取得更加全面的、动态的的分析结果
3、进行数据发掘
就是从海量数据中,发掘出具有价值的数据
通过对数据的发掘其一、可以发现数据的历史规律,对过往进行总结
其二、可以根据数据对未来进行猜测
企业可以根据猜测对未来行情趋势做出预判,并作出相干决策
4、数据可视化,我想任何人看到一推数据,就会感到很头疼
固然也很不直观,到底企业的各项指标相比往年是好是坏往做对照也会很麻烦
使用各种图表、三维地图、动态摹拟和相干的动画技术是本来枯燥乏味的数据,变得生动起来
数据可视化把数据以更加直观的形态展现出来,令人们对相干数据做到一目了然
5、通过上面几步我们就把本来毫无价值的数据,变成了信息,最后演化为知识
其次,我们北京大学青鸟公司应当斟酌的:1、是不是有必要建立数据仓库
固然我这个题目我也在线上向ibm数据仓库的职员询问过
要斟酌的有两个因素:其一、数据量的级别,其二、对数据发掘的程度
第1页共3页一、数据量
收集器实时都对新闻、论坛、博客、微博在进行收集,固然假如说一年的数据量不算大的话,亦或宁波本地的数据量也没那末大的话
公司假定几年后、几十年后业务量增