部署指南ClouderaManagerCDH官方共给出了3中安装方式
第一种方法必须要求所有机器都能连网,由于各种网络超时错误,基本没法用
第二种方法使用CM的在线yum源,在线下载很多包,同样是超时严重
第三种方法是全离线方式,实际情况是也只能用这个
1、ClouderaManager的部署条件CDH不支持在容器中部署
支持OracleJDK7,目前可使用的最新版本为1
7u80,C5
x及以上版本也支持使用oracleJDK8,同一个CDH集群中的所有节点使用的JDK版本必须一致
使用Python2
4及以上,不支持Python3仅支持IPv4,且IPv6必须要disabled基于tar压缩包的离线安装方式,会在6
0中停止支持该方式
支持selinux,但如果不熟悉使用方法,建议关闭
管理端口为7180,此外还有很多基础应用使用的端口,可以运行iptables,需要确认有恰当的授权控制,例如至少要对同网段的访问放开全部端口
2、ClouderaManager部署的几个阶段和可选择的方式注:因为ClouderaManager的官方yum源位于国外,受网速影响而无法正常使用
所以上述部署方式中,一般是使用PATHC,或者在预先下载好相关RPM包的条件下参照PATHB方式
3、主机节点信息和基础配置(1)主机信息本次部署使用以下主机,前两个作为NameNode使用
后四个主机,分别额外挂载一块1TB的磁盘到本地的/dfs/dn目录下
注1:用于大数据平台的数据磁盘不要配置RAID,直接祼盘即可
如果有RAID控制器,则直接对每块盘设置一个单独的RAID0,仍然当作单盘使用
注2:在有第二块数据盘的情况下,继续挂载到/dfs/dn2,更多的数据盘则按命名规则和挂盘规则扩展即可
注3:对于生产环境而言,NameNode所在的节点一般不要同时做数据节点使用