第1章初识FlinkFlink是Apache基金会旗下的一个开源大数据处理框架
目前,Flink已经成为各大公司大数据实时处理的发力重点,特别是国内以阿里为代表的一众互联网大厂都在全力投入,为Flink社区贡献了大量源码
如今Flink已被很多人认为是大数据实时处理的方向和未来,许多公司也都在招聘和储备掌握Flink技术的人才
那Flink到底是什么,又有什么样的优点,能够让大家对它如此青睐呢
本章我们就来做一个详细的了解
首先讲述Flink的源起和设计理念,接着介绍Flink如今的应用领域;进而通过梳理数据处理架构的发展演变,解答为什么要用Flink的疑问
进而梳理Flink的特点,并同另一个流行的大数据处理框架Spark进行比较,从而更深刻地理解Flink的底层架构和优势所在
1Flink的源起和设计理念Flink起源于一个叫作Stratosphere的项目,它是由3所地处柏林的大学和欧洲其他一些大学在2010~2014年共同进行的研究项目,由柏林理工大学的教授沃克尔·马尔科(VolkerMarkl)领衔开发
2014年4月,Stratosphere的代码被复制并捐赠给了Apache软件基金会,Flink就是在此基础上被重新设计出来的
在德语中,“flink”一词表示“快速、灵巧”
项目的logo是一只彩色的松鼠,当然了,这不仅是因为Apache大数据项目对动物的喜好(是否联想到了Hadoop、Hive
),更是因为松鼠这种小动物完美地体现了“快速、灵巧”的特点
关于logo的颜色,还一个有趣的缘由:柏林当地的松鼠非常漂亮,颜色是迷人的红棕色;而Apache软件基金会的logo,刚好也是一根以红棕色为主的渐变色羽毛
于是,Flink的松鼠Logo就设计成了红棕色,而且拥有一个漂亮的渐变色尾巴,尾巴的配色与Apache软件基金会的logo一致
这只松鼠色彩炫目,既呼应