栢图教育Oracle 高级课程——理论教材 第一章 集群的概念和发展 1 集群的概念 1.1 集群相关术语定义 1.1.1 服务硬件 服务硬件是指提供计算服务的硬件,比如 PC 机、PC 服务器。 1.1.2 服务实体 服务实体通常指服务软体和服务硬体。 1.1.3 节点(node) 运行 Heartbeat 进程的一个独立主机称为节点,节点是 HA 的核心组成部分,每个节点上运行着操作系统和Heartbeat 软件服务。在 Heartbeat 集群中,节点有主次之分,分别称为主节点和备用/备份节点,每个节点拥有一个唯一的主机名,并且拥有属于自己的一组资源,例如磁盘、文件系统、网络地址和应用服务等。主节点上一般运行着一个或者多个应用服务,而备用节点一般处于监控状态。 1.1.4 资源(resource) 资源是一个节点可以控制的实体,当节点发生故障时,这些资源能够被其他节点接管。在 Heartbeat 中,可以当做资源的实体如下: (一) 磁盘分区、文件系统 (二) IP 地址 (三) 应用程序服务 (四) 共享存储 1.1.5 事件(event) 事件也就是集群中可能发生的事情,例如节点系统故障、网络连通故障、网卡故障和应用程序故障等。这些事件都会导致节点的资源发生转移,HA 的测试也是基于这些事件进行的。 1.2 什么是集群 简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源,这些单个的计算机系统就是集群的节点(node)。一个理想的集群是,用户从来不会意识到集群系统底层的节点,在他们看来,集群是一个系统,而非多个计算机系统;并且集群系统的管理员可以随意的增加和删改集群系统的节点。与单一服务实体相比较,集群提供了以下两个关键的特性。 (一) 可扩展性。集群的性能不限于单一的服务实体,新的服务实体可以动态的加入到集群,从而增强集群的性能。 (二) 高可用性。集群通过服务实体冗余使客户端免于轻易遭遇到“out of service”警告。当一台节点服务器发生故障的时候,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。消除单点故障对于增强数据可用性、可达性和可靠性是非常重要的。 为了具有可扩展性和高可用性的特点,集群必须具备以下两大能力。 栢图教育Oracle 高级课程——理论教材 (一) 负载均衡。负载均衡能把任务比较均匀的分布到集群环境下的计算和网络资源,以便提高数据吞吐量。 (二) 错误恢复。如果集群中的某一台服务器由于故障或者维护需要而无法使用,资源和应...