Linux高性能计算集群 -- Beowulf 集群 1 集群 1
1 什么是集群 简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源
这些单个的计算机系统就是集群的节点(node)
一个理想的集群是,用户从来不会意识到集群系统底层的节点,在他/她们看来,集群是一个系统,而非多个计算机系统
并且集群系统的管理员可以随意增加和删改集群系统的节点
2 为什么需要集群 集群并不是一个全新的概念,其实早在七十年代计算机厂商和研究机构就开始了对集群系统的研究和开发
由于主要用于科学工程计算,所以这些系统并不为大家所熟知
直到 Linux 集群的出现,集群的概念才得以广为传播
对集群的研究起源于集群系统的良好的性能可扩展性(scalability)
提高CPU 主频和总线带宽是最初提供计算机性能的主要手段
但是这一手段对系统性能的提供是有限的
接着人们通过增加 CPU 个数和内存容量来提高性能,于是出现了向量机,对称多处理机(SMP)等
但是当 CPU 的个数超过某一阈值,象 SMP 这些多处理机系统的可扩展性就变的极差
主要瓶颈在于 CPU 访问内存的带宽并不能随着 CPU 个数的增加而有效增长
与 SMP 相反,集群系统的性能随着 CPU 个数的增加几乎是线性变化的
图 1 显示了这中情况
几种计算机系统的可扩展性 集群系统的优点并不仅在于此
下面列举了集群系统的主要优点: 1
高可扩展性:如上所述
高可用性:集群中的一个节点失效,它的任务可以传递给其他节点
可以有效防止单点失效
高性能:负载平衡集群允许系统同时接入更多的用户
高性价比:可以采用廉价的符合工业标准的硬件构造高性能的系统
1 集群系统的分类 虽然 根据集群系统的不同特征可以有多种分类方法,但是一般我们把集群系统分为两类: