根据目前行业用户的需求情况和未来的发展性考虑,不少IDC服务商都推出了可实施的成熟方案。比如时代互联双机系统由2台时代互联服务器、1台磁盘阵列系统、2套HA双机软件组成。两台服务器硬软配置完全相同,工作于双机互备模式。共同对外提供一个唯一的IP地址、计算机名以及其他的共享资源,互相监控及互为备援。
近年来,随着计算机技术的飞速发展,服务器的性能有了大幅度的提升,服务器作为处理关键性事物的业务主机已随处可见.对于要求有高可用性和高安全性的系统,比如金融,邮电,交通,石油,电力,
保险证券等行业,用户提出了系统容错的要求.久强世纪公司推出基于Cluster集群技术的双机互备援解
决方案,包括用于对双服务器实行监控的HA 容错软件和作为数据存储设备的系列磁盘阵列系统.通过软
硬件两部分的紧密配合,提供给客户一套具有单点故障容错能力,且性价比优越的用户应用系统运行平台.
1.2 Cluster集群技术
Cluster集群技术:一组相互独立的服务器在网络中表现为单一系统,并以单一系统的模式加以管理.
此单一系统为客户工作站提供高可靠性的服务.
Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可
被所有的网络客户所使用.Cluster必须可以协调管理各分离的组件的错误和失败,并可透明的向Cluster
中加入组件.
一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器.任何一台服务器运行一个应用
时,应用数据被存储在共享的数据空间内.每台服务器的操作系统和应用程序文件存储在其各自的本地储
存空间上.
Cluster内各节点服务器通过一内部局域网相互通讯.当一台节点服务器发生故障时,这台服务器上
所运行的应用程序将在另一节点服务器上被自动接管.当一个应用服务发生故障时,应用服务将被重新启
动或被另一台服务器接管.当以上任一故障发生时,客户将能很快连接到新的应用服务上.
1.3久强世纪 Storage Solution 双机容错系统方案
Cluster集群可由N台服务器组成,当Cluster最小值N=2时,即为双机容错集群系统.
久强世纪Cluster双机容错系统结合了磁盘阵列产品的安全可靠性与HA监控软件技术的优点,将二
者的优势相互配合.使用软件与磁盘阵列结合的方案,可以有效提高主机工作效率,减轻服务器和网络设
备压力,保证系统稳定性.
二,系统概述
2.1 功能概述
·如果硬盘发生故障时,磁盘阵列柜会有蜂鸣声告警,同时硬盘架面板上的状态指示灯变成红色(正
常时为绿色),以便提醒用户进行及时有效的维护
·独特的硬盘保护环路设计,可以确保故障硬盘插拔时,即刻隔断与SCSI总线的连接,而不会影响
SCSI总线上的信号
·即时响应: 控制器在硬盘发生故障时即刻识别错误信息
·支持环境监控(当机箱内温度过高时会有蜂鸣告警声)
·冗余电源备份(支持热插拔)
·热插拔风扇
·系统安全密码锁定
·当柜门关闭时,仍可观察到控制器及硬盘工作状态
·支持不同品牌,容量,型号的SCSI硬盘
2.2 阵列柜结构
AccuSTOR S940阵列柜的组成包括RAID控制器,双电源保护装置,支持热插拔的硬盘盒(Mobile Rack)
等,大部分部件具有冗余能力,可以全面保护硬盘和数据的安全.
AccuSTOR S940的RAID控制器使用64-bit RISC处理器,基本缓存(CACHE)为64MB, 控制器提供4个
通道(Channel),其中两个为主机通道(Host Channel),2个为设备通道(Disk Channel),可同时接驳8块
硬盘,最大RAID5容量为7X146GB=1.02TB.
在控制器中,可以方便的给设置0,1,3,5,0+1级的RAID组.控制器带有Monitor接口,用户可
以通过该接口使用终端或终端仿真程序进行设置,可以对控制器的BIOS程序进行升级.
在阵列柜的顶部预留一个插槽,用户可以选装一个备份RAID控制器,以提高系统的可靠性.
AccuSTOR S940或内部与SCSI硬盘的接口是采用SCA-2规格的整体式后背板,可以直接使用80Pin
热插拔硬盘,配备转换口后,也可使用80Pin Ultra2/Ultra160硬盘.每一硬盘插槽配有隔绝保护IC,以
消除硬盘在热插时的电流负效应,避免瞬间电流造成对硬盘或控制器的损害.
AccuSTOR S940阵列柜安装双份热插拔电源,每个电源的功率300W,通过调整电压开关该电源可以在
110/220V电压下工作.
正常情况下,双电源在Share状态工作,各输出150W功率,保证电源的使用寿命.如果其中一只电
源发生故障,另一电源将自动转换到300W 输出功率状态,使阵列继续正常运转.同时系统将通过液晶屏
幕和蜂鸣方式发出警报,用户可以将损坏的电源直接拔除,而不必关闭阵列.
机箱后背板上装有四个热插拔冷却风扇,风扇的启动温度和转速受ENC控制,用户可以通过ENC上的
DIP开关进行设定.所有风扇均采用德国标准的三钢珠结构,使其使用寿命大大延长.
阵列柜中安置有8个硬盘盒,可以接驳80针Ultra2/Ultra160 SCSI硬盘和SCA硬盘,普通硬盘接入
阵列后,即支持热插拔功能.Mobile Rack可自动为硬盘设置ID,前面板上有指示灯,可以显示硬盘的工
作状态.
阵列柜后面板上装有HOST-A,HOST-B接口各两个,用来接驳主机.Monitor口可接至终端或PC机,
用来进行阵列的设置.Modem口可以接驳调制解调器,用于传真和Pager方式的远程报警.UPS口可连接
UPS电源,当断电时UPS系统会送出一PowerFail信号到此UPS接口上,此时磁盘阵列控制器会即刻将缓
存(Cache)的资料完整地写入磁盘中,并关闭缓存,如服务器再有资料传来则会直接写入硬盘内,直到电
源恢复正常.两个设备通道接口配备终结器,用户可以串联机柜或其他SCSI设备.
2.3 双机容错系统软件 HA
久强世纪 Storage Solution双机容错系统解决方案提供专用双机软件:HA.
HA For NT 作为目前市场上最为成熟的双机容错软件,以其友好图形操作界面,方便的配置与管理被
广泛应用于政府,学校,电信,电力,石油,交通等行业.
通过装在两个服务器中的双机热备份应用软件HA,系统具有在线容错能力,即当处于工作状态的服
务器无法正常工作时,通过双机系统容错软件,使处于守候监护状态的另一台服务器迅速接管不正常服务
器上的业务程序及数据资料,使得网络用户的业务交易正常运行,保证交易数据的完整一致性及交易业务
的高可靠性.
通过架设与两台服务器间的侦测网络,HA for NT软件能够对两台服务器的软硬件运行状态实行监控.
HA For NT具有两种工作模式:
Hot Standby:即双机热备份,两台服务器为生产机--备份机关系.当生产机发生故障时,备份机自
动接管生产机的任务和数据,使拥护业务交易正常运行.使用者可在最短时间内回复作业,使客户的应用
不必中断,减少主机停机所造成的损失.
Daul Active:即双机互备援.两台服务器各运行不同的应用任务,并互相作为备份机.当两部主机
中任一主机当机时,另一部主机可迅速接替故障主机任务.
三,系统整合
久强世纪 Storage solution双机容错系统是由HA容错软件与磁盘阵列有机组合的成熟方案.整个
系统的组合架构工作包括三个方面:
1)硬件系统的连接
2)容错软件的安装和配置
3)与用户应用的整合
3.1 硬件系统的连接
硬件部分的连接主要包括磁盘阵列与主机的连接和侦测网络的连接.
用户可以将支持多主机的磁盘阵列系统分别连接至两台服务器的SCSI接口. 磁盘阵列系统提供两条
标准68Pin外接SCSI电缆,可与任何服务器的Ultra 3 SCSI接口接驳.用户不需要在服务器上增加任何
硬件设备或驱动程序.磁盘阵列连接至主机后,用户可以象增加普通硬盘那样对其进行分区,格式化,安
装文件系统等操作.
HA for NT可使用三种侦测网络.
RS232线路:只需使用软件附带的专用电缆将两台服务器的串口连接即可
TCP/IP:使用直连网线或通过交换设备(Switch或Hub)连接两台服务器的网卡
Share Disk:在磁盘阵列柜上设置双主机共享的8MB分区
以上三种侦测网络可同时使用,互为备份,有利于提高双机系统的可靠性.
3.2 容错软件的安装和配置
HA容错软件的安装简单快捷.整个安装过程中,用户不需要进行繁琐的安装选择,或更改服务器硬
件配备或操作系统设定与容错软件配合.
HA for NT具有友好图形用户界面(GUI),使容错软件的配置管理成为轻松的工作.
3.3 与用户应用的整合
久强世纪 Storage solution双机容错控制系统能够提供具有相当容错能力的应用系统平台.它既可
以同所有大型数据库配合使用,也可监管用户自主开发的应用软件.在与容错系统整合时,只需将数据库
系统分别在两台服务器安装,并将数据文件放置于共享的磁盘阵列即可,而不需要对应用程序进行任何更
改.
双机热备是应用于服务器的一种解决方案,其构造思想是主机和从机通过TCP/IP网络连接,正常情况下主机处于工作状态,从机处于监视状态,一旦从机发现主机异常,从机将会在很短的时间之内代替主机,完全实现主机的功能。
双机热备就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。
扩展资料:
双机热备原理:
双机热备主要是实时数据、报警信息和变量历史记录的热备。主从机都正常工作时,主机从设备采集数据,并产生报警和事件信息。从机通过网络从主机获取实时数据和报警信息,而不会从设备读取或自己产生报警信息,主从机都各自记录变量历史数据。
同时,从机通过网络监听主机,从机与主机之间的监听采取请求与应答的方式,从机以一定的时间间隔(冗余机心跳检测时间)向主机发出请求,主机应答表示工作正常,主机如果没有作出应答,从机将切断与主机的网络数据传输,转入活动状态,改由下位设备获取数据,并产生报警和事件信息。此后,从机还会定时监听主机状态,一旦主机恢复,就切换到热备状态,通过这种方式实现了热备。
参考资料来源:百度百科-服务器
参考资料来源:百度百科-双机热备
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)