Hadoop 集群配置(最全面)您的评价 : 收藏该经验通常,集群里的一台机器被指定为NameNode,另一台不同的机器被指定为 JobTracker
这些机器是 masters
余下的机器即作为DataNode也作为 TaskTracker
这些机器是官方地址:( http://hadoop
apache
org/common/docs/r0
2/cn/cluster_setup
html)1 先决条件1
确保在你集群中的每个节点上都安装了所有必需 软件:sun-JDK ,ssh,Hadoop 2
JavaTM1
x ,必须安装,建议选择Sun 公司发行的 Java 版本
ssh必须安装并且保证sshd 一直运行,以便用Hadoop 脚本管理远端Hadoop守护进程
2 实验环境搭建 2
1 准备工作操作系统: Ubuntu 部署: Vmvare 在 vmvare 安装好一台 Ubuntu 虚拟机后,可以导出或者克隆出另外两台虚拟机
准备机器:一台 master ,若干台 slave ,配置每台机器的 /etc/hosts保证各台机器之间通过机器名可以互访,例如: 10
76 node1(master ) 10
77 node2 (slave1 ) 10
78 node3 (slave2 )主机信息 : 机器名IP 地址作用Node1 10
76 NameNode、JobTracker Node2 10
77 DataNode、TaskTracker Node3 10
78 DataNode、TaskTracker 为保证环境一致先安装好JDK和 ssh:2
2 安装 JDK #安装 JDK $ sudo apt-get install sun-java6-jdk1