大数据技术实践实验报告

下载本文档

阅读 155
下载 10
格式 pdf
大小 5.05 MB
约59页
2024-12-26 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/59页

2/59页

3/59页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/59

文本预览下载提示常见问题

实验报告课程名称：大数据技术实践实验项目：大数据平台实验仪器： PC 机学院：计算机学院专业：计算机科学与技术班级姓名： * 学号： * 日期： 2019-5-9 指导教师： * 成绩：一. 实验目的 1. 熟练掌握大数据计算平台相关系统的安装部署 2. 理解大数据MapReduce 计算模型，并掌握MapReduce 程序开发 3. 掌握Hive 的查询方法 4. 掌握Spark 的基本操作二. 实验内容 1. Hadoop 完全分布模式安装 2. Hadoop 开发插件安装 3. MapReduce 代码实现 4. Hive 安装部署 5. Hive 查询 6. Spark Standalone 模式安装 7. Spark Shell 操作三. 实验过程 Hadoop 开发插件安装实验步骤： 1.Eclipse 开发工具以及Hadoop 默认已经安装完毕，安装在/apps/目录下。 2.在Linux 本地创建/data/hadoop3目录，用于存放所需文件。切换目录到/data/hadoop3目录下，并使用 wget 命令，下载所需的插件hadoop-eclipse-plugin-2.6.0.jar。 2. 将插件hadoop-eclipse-plugin-2.6.0.jar，从/data/hadoop3目录下，拷贝到/apps/eclipse/plugins 的插件目录下。 3. 进入 ubuntu 图形界面，双击 eclipse 图标，启动 eclipse。 5.在 Eclipse 窗口界面，依次点击 Window => Open Perspective => Other 。弹出一个窗口。选择Map/Reduce，并点击OK，可以看到窗口中，有三个变化。（左侧项目浏览器、右上角操作布局切换、面板窗口）如果在 windows 下，则需要手动调出面板窗口Map/Reduce Locations 面板，操作为，点击window => show view => Other。在弹出的窗口中，选择Map/Reduce Locations 选项，并点击OK。这样便可以调出视图窗口Map/Reduce Location。 6.添加 Hadoop 配置，连接 Hadoop 集群。在这里添加Hadoop 相关配置。 Location name，是为此配置起的一个名字。 DFS Master，是连接 HDFS 的主机名和端口号。点击 Finish 保存配置。 7.另外还需保证Hadoop 中的HDFS 相关进程已经启动。在终端命令行输入jps查看进程状态。 view plain copy 1. jps 若不存在hdfs 相关的进程，如Namenode、Datanode、secondarynamenode，则需要先切换到 HADOOP_HOME 下的sbin 目录，启动hadoop。 view plain copy 1. cd /apps/hadoop/sbin 2. ./start-all.sh 8.展开左侧项目浏览视图，可以看到 HDFS 目...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容