Hadoop 平台搭建与应用教 案NO
1教师姓名授课班级授课形式理实一体化授课时间年 月 日第周授课时数10授课章节名称任务1
1 认知大数据,完成系统环境搭建教学目的(1)熟悉大数据的概念和特征
(2)熟悉大数据分析流程和工具使用
(3)学会CentOS 的安装
(4)学会CentOS 中常用命令的使用
教学重点CentOS 中常用命令的使用教学难点CentOS 中常用命令的使用更新、 补充、删节内容课外作业熟练 Hadoop 的安装与配置教学过程教学提示一
大数据背景知识大数据是时下 IT 界最炙手可热的名词,在全球引领了新一轮数据技术革命的浪 潮,通过 2012 年的蓄势待发,2013 年被称为“世界大数据元年",标志着世界正式步 入了大数据时代
Hadoop 从某些方面来讲,与大数据结合紧密,它最擅长的就是高效 地处理海量规模的数据,它就是为大数据而生的
想要系统地认知大数据,必须要全面而细致地分解它,接下来将从 3 个层面展 开介绍,如图 1T 所示
第 1 个层面是理论
理论是认知的必经途径,也是被广泛认同和传播的基线
第 2 个层面是技术
技术是大数据价值体现的手段和前进的基石
第 3 个层面是实践,实践是大数据的最终价值体现
人们分别从互联网的大数 据、政府的大数据、企业的大数据和个人的大数据 4 个方面出发,去描绘大数据己 经展现的美好景象及即将实现的蓝图
(1)从理论层面认知大数据大数据的特征定义
最早提出大数据时代到来的是麦肯锡咨询公司
它是美国首 屈一指的咨询公司,是研究大数据的先驱
业界(IBM 最早定义)将大数据的特征归 纳为 4 个 V
数据体量巨大(Volume):大数据的起始计量单位至少是 PB (1 000TB)、EB (10'TB)或 ZB (109TB)„b
数据类型繁多(Variety):如网络日志、