下载后可任意编辑Linux 下 Hadoop 分布式配置和使用(适用于 0.20 及以后版本)詹坤林 2024 年 5 月目 录介绍................................................................20 集群网络环境介绍..................................................21 /etc/hosts 文件配置...............................................22 SSH 无密码验证配置................................................32.1 选择一:配置 Namenode 无密码登录所有 Datanode.................32.1 选择二:配置所有节点之间 SSH 无密码验证.......................43 JDK 安装和 Java 环境变量配置.......................................53.1 安装 JDK 1.6................................................53.2 Java 环境变量配置............................................54 Hadoop 集群配置...................................................55 Hadoop 集群启动...................................................86 Hadoop 使用......................................................106.1 客户机与 HDFS 进行交互......................................106.1.1 客户机配置............................................106.1.2 列出 HDFS 根目录/下的文件..............................116.1.3 列出当前用户主目录下的文件............................116.1.4 HDFS 用户管理.........................................116.1.5 复制本地数据到 HDFS 中.................................126.1.6 数据副本说明..........................................126.1.7 hadoop-site.xml 参数说明..............................136.1.8 HDFS 中的路径.........................................136.1.8 Hadoop 相关命令.......................................141下载后可任意编辑6.2 客户机提交作业到集群.......................................146.2.1 客户机配置............................................146.2.2 一个测试例子 WordCount................................156.2.3 编写 Hadoop 应用程序并在集群上运行.....................166.2.4 三种模式下编译运行 Hadoop 应用程序.....................166.2.5 提交多个作业到集群..................................