下载后可任意编辑2024 年大数据职业规划总结前言这是我的第一篇博客,写起来还真是有些小紧张~~~还请有缘看到的朋友多指点
打算开始写这些东西的契机是师兄给布置的学习记录作业,而我自己这方面的原因倒主要不是记录学习(写这些东西好花时间呀
),而是看到好多大神,尤其是国外的,都在贡献自己的知识,我被他们的精神感染了,也想自己贡献些东西
大数据相关工作分类大体可分为四种:运维平台开发数据分析数据科学家其中,平台开发(大数据工程师),基本是结合公司业务场景及需求,以现已开源的大数据组件为基础,打造公司自己的大数据平台;数据分析则是运用公司的平台,在其之上做些报表和数据变现(听师兄说大公司将平台封装的很好,基本上都是敲 SQL);至于运维,自然是为前两者提供集群支持,如资源分配,组件配置优化等
在这三者之上便是数据科学家啦
之前通过知乎 Live 得知,这里的数据科学家和大家传统理解的科学家不一样,就只是一个职业称呼
引用知乎上北冥承海生的话:数据科学家是指能采纳科学的方___,调动充足的计算能力,将大量人类无法处理的数据转化成有用的信息,以驱动自动化业务决策的专家
其中科学的方___指的是坚实的理论基础;大量的数据指如行为日志这种海量数据;自动化业务决策是数据科学家的核心工作,体现数据优先与经验,计算优先于人工的价值观
理论基础方面,北冥承海生推举了几本书:第 1 页共 8 页下载后可任意编辑机器学习:PRML、DeepLearning 最优化:Conve__Optimi__ation、NumericalOptimi__ation 分布式计算:Hadoop/Spark 各种书籍和 MOOC其中,最优化好像很重要,因为这些平常遇到的问题,其本质好像都可以归为一个优化问题,更一般的描述是求一个条件极值
至于将实际问题建成数学模型,及对已知的问题提供现在未知的解决方法,北冥承海生说