ROSE HA在系统故障时的自动切换能力
当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),Rose HA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。
ROSE HA的自动检测
在集群系统的每一台服务器内,RoseHA具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复。
ROSE HA实现服务器的可靠性
在主服务器出现故障(如掉电或宕机)时,另外一台服务器接管故障服务器上运行的所有的关键性应用。
ROSE HA实现网络可靠性
如果服务器的网络部分发生故障,会导致客户不能连接和访问到服务器,这同样是致命的故障。如果该服务器配备了冗余的网络接口,Rose HA会使用它来恢复网络连接。在没有配备冗余的网络接口,或者所有的网络接口均出现故障时,HA会将该应用切换到另外一台服务器上。切换完成后,客户在短暂的切换过程后能够继续访问所需的服务。
ROSE HA实现存储可靠性
需要将应用的全部数据存储在两台服务器都能访问到的共享磁盘中。建议使用磁盘阵列来存储数据,这样可以避免单点固障,而且便于对系统的容量进行扩充。对由Volume Manager软件管理的磁盘阵列,Rose HA提供了相应的处理程序,以保证磁盘阵列及数据的可靠性。
ROSE HA的应用可靠性
在高可用性系统中可以运行多个应用。每一个应用是作为一个服务而存在的。在服务器中,当某个服务失败而其它服务正常运行时,Rose HA将处理这个失败的服务。在将这个服务切换到另一台服务器上时,该服务器上运行的服务也不会受到影响。对于与网络不相关的纯数据应用,只需要切换数据存储和数据处理软件。而在与网络相关的客户机/服务器应用,除了要切换数据存储和数据处理软件外,还需要切换相关的虚拟IP。如果希望两个服务独立地进行切换,则此两个IP地址不能相同。如果使用了相同的IP地址,在发生切换时,Rose HA会将所有使用该IP的服务都切换到另外一台服务器上去。
ROSE HA丰富的附加功能
提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),使用者可针对特定的服务编写Agent程序,执行与特定服务相关的状态诊断及错误恢复工作的。