服务器技术之硬件冗余技术
硬件冗余技术是最常见、最基本的服务器技术之一,也是应用最广泛的服务器通用技术。它是通过提供双份完全一样的硬件,并通过相应的技术设备用件时刻处于待命状态,发现相应部件失效后立即接替原来的部件继续工作,使得服务器保持恒久不间断的运作。它是提供服务器可用性的一个重要手段。根据不同的冗余部位和冗余程度,主要分为以下几种硬件冗余方式。
1.单击容错冗余
这时一种级别的冗余,达到了100%冗余。在这样一个服务器中,对所有部件都提供了冗余,任何单一部件的损坏都不会造成硬盘中的数据丢失。其实这也是一种单机容错技术,是在一台服务器中提供两套完整的服务器配件,当然都不是简单地堆放,而是采取失效,立即启用冗余部件。它比我们后面将要介绍的双机容错技术的容错级别高些,不过采用这种冗余方式的代价较高,除非在一些对容错性能的要求特别苛刻的环境,如金融、证券系统等。
如图1-36所示的是NEC公司的一款单机容错服务器。该产品是对处理器、内存、磁盘及电源等所有主要组件均实行双重配置,实现容错。在同一时刻,双份的容错硬件部件处理相同的指令。在一个部件出现故障的情形下,故障部件自动分类,其冗余部件像激活了的备份,继续正常操作。系统不会停机,也不会丢失数据。每一组双重配置的硬件均同时完成相同的工作,为银行、证券等有着特别苛刻需求的关键领域提供高等级的可靠性。
2.双服务器冗余
这种冗余方式指采用双台服务器进行冗余容错,将双台服务器分为主/从服务器,从服务器是为主服务器出现故障而准备的,不过这一容错技术需要专门的服务器集群技术来实现。当主服务器出现故障时,从服务器将立即接替主服务器的工作,从而使得任何一台服务器出现故障都不会造成系统崩溃。
如图1-37所示的是一款支持双机容错的服务器。它的双机容错方案,是将两台Powerleader Pl4400R服务器通过一条100MB网络线相连,专门用于两台服务器的心跳监测、数据同步链路,不再占用客户机与服务器通信时的应用网卡资源。平时,主服务器处理作业和数据,发生故障后,备用服务器自动接管主服务器的作业和数据,同时自动接管主服务器的主机名及网络地址,而客户可以继续运行,无须重新启动机器。待主服务器修复好以后,再将备用服务器上的作业和数据切换到主服务器上,而备用服务器又恢复到备用等待状态。
3.磁盘冗余
这是最常见的硬件冗余方式之一,是提供多个备用磁盘。当然这些磁盘不是像其他冗余部件一样消极等待,而是时刻处于激活的热备份状态,以与当前的活动磁盘保持同步。在这种冗余方式中,应用最广的是磁盘冗余阵列技术(RAID)。
4.电源冗余
电源冗余和下面将要介绍的风扇冗余是目前服务器中最常见的硬件冗余之一,它们都是为了提高服务器的可用性。很明显,电源冗余是在一台服务器中同时提供两个电源,通常是一个电源处于工作状态,另一个电源则处于待命状态,当当前电源出现故障时,备用电源立即接替它继续工作,使得任何一个电源故障都不会造成系统停机。如图1-38所示的是一台具有两个电源的服务器。
5.风扇冗余是指服务器的关键发热部件上配置的降温风扇,有主、备件两套,这两套风扇都具有自动切换功能,并支持风扇转速的实时监测、发生故障时可自动报警并启用备用风扇等功能。若系统正常,则备用风扇不工作,而当主风扇出现故障或其转速低于规定的标准时,备用风扇马上自动启动,从而避免由于系统风扇损坏而导致系统内部温度升高,使得服务器工作不稳定或停机,如图1-39所示。
6.网卡冗余
网卡冗余是在一台服务器中同时提供两块相同的网卡,其中一块处于工作状态,另一块处于待命状态。这样一旦当前工作的网卡损坏,冗余网卡可立即接替故障网卡继续工作,不会造成网络服务中断。
其实在硬件冗余方面有的品牌还提供了RAM、PCI适配器、网卡、内存,甚至CPU冗余等技术,在此不一一细讲了。服务器的可靠性,不仅体现在硬件的冗余上,还体现在一些硬件在线诊断技术上,因为硬件的冗余毕竟有条件限制,我们不可能对所有配件都进行冗余,那样大大提高服务器的成本。