大数据分析三个技巧:03 来源:CIO 时代网【文章摘要】大数据性质是有她三个特点(数据量大、种类多、解决速度快)决定,数据分析角色和作用理所固然是由大数据性质决定。当数据分析作用于大数据时,大数据必要身兼数职。意思就是数据分析在一种组织中扮演着各种角色和肩负着多重责任。 数据分析职位是由 DJ Patil 和 Jeff Hammerbacher 制定,她们试图称呼数据组同事们,而又不想由于称呼而限制她们能力。(because of improper job title like business analyst or research scientist Building Data Science Teams) 随着大数据在驱动公司成功中越来越有决定性作用,数据分析也变得越来越受欢迎。然而,某些领导者对数据分析扮演角色和它所起作用依旧不是很了 解,就像诸多时候领导者不懂得怎么从大数据中抽取有用信息,虽然很清楚懂得这些大数据是很可信。她们脚步落后了——她们眼光在大数据运用上其 实是模糊。 大数据性质是有她三个特点(数据量大、种类多、解决速度快)决定,数据分析角色和作用理所固然是由大数据性质决定。当数据分析作用于大数据时,大数据必要身兼数职意思就是数据分析在一种组织中扮演着各种角色和肩负着多重责任。 各种知识掌握 为理解决数据量大问题,大数据平台(例如:Apache Hadoop、LexisNexis HPPC)规定数据是被整顿过。数据分析员应当具备大数据平台应用全方位知识,这样才能纯熟应用数据平台解决大数据。数据分析元应当具备如下知识: 1、理解大数据平台框架,例如:DFS 和 MapReduce,她们编程框架提供强大应用程序设计。这就意味着数据分析员还要有软件构筑和设计能力。 2、精通大数据平台支持编程语言,例如:Java,Python,C++,or ECL,等等。 3、具备纯熟数据库知识,特别是用到 SQL 语言数据库,像:HBase,CouchDB,等等。由于大数据平台常常需要数据库来存储和转换数据。 4、具备数学/记录学、机器学习、数据挖掘领域专业知识。 一种公司成功不是由数据量决定,而是由能否成功从大数据中发现和抽取有用知识模式和关系决定,然后用这些有价值信息制造出有价值产 品。记录学、机器学习和数据挖掘可以较好用于理解数据和发掘数据价值。自然,为了成功数据分析者必要具备这些领域专门知识。会使用某些数据挖掘工具 或者平台(例如:R,Excel,SPSS and SAS)是最佳,可以《Top Analytics and big data software tools》这本书。 5、纯熟应用自然...