双机热备是应用于服务器的一种解决方案,其构造思想是主机和从机通过TCP/IP网络连接,正常情况下主机处于工作状态,从机处于监视状态,一旦从机发现主机异常,从机将会在很短的时间之内代替主机,完全实现主机的功能。
双机热备就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。
扩展资料:
双机热备原理:
双机热备主要是实时数据、报警信息和变量历史记录的热备。主从机都正常工作时,主机从设备采集数据,并产生报警和事件信息。从机通过网络从主机获取实时数据和报警信息,而不会从设备读取或自己产生报警信息,主从机都各自记录变量历史数据。
同时,从机通过网络监听主机,从机与主机之间的监听采取请求与应答的方式,从机以一定的时间间隔(冗余机心跳检测时间)向主机发出请求,主机应答表示工作正常,主机如果没有作出应答,从机将切断与主机的网络数据传输,转入活动状态,改由下位设备获取数据,并产生报警和事件信息。此后,从机还会定时监听主机状态,一旦主机恢复,就切换到热备状态,通过这种方式实现了热备。
参考资料来源:百度百科-服务器
参考资料来源:百度百科-双机热备
我这里有一个双机方案文档 你可以参考下IBM x3650 DS3200 双机热备方案
IBM X3650服务器+DS3200 SAS 磁盘柜双机热备方案
双机热备方案所需软硬件清单如下:
1、IBM X3650 服务器2台(具体配置根据需求选配)
2、IBM DS3200 磁盘柜一台(单控制器,单SAS 接口)
3、SAS HBA 卡2块(每台服务器各加一块)
4、双机模块(子卡)一块
5、SAS 连接线2条
6、双机热备软件(ROSE HA OR LIFEKEEPER )一套
DS3200/DS3400安装心得及技巧
这应该是网络上第一篇关于IBM System Storage DS3200和DS3400产品安装的非官方性文章,希望可以对大家的工作中带来帮助。
作为DS400产品的更新型号,DS3200和DS3400提供了更强的性能及灵活性,相信会成为今后一两年内的IBM低端存储产品的首选。
DS3200和DS3400均出自于LSI公司的Engenio系统(DS4000系列的大部分产品也是由Engenio为IBM协议设计及生产,去年Engenio被LSI收购)。所以设计思想和结构与DS400(Adapter公司设计)会有较大的不同,管理方式也会与DS4000系列较为接近。
DS3000系列均需要在自身上安装不少于4个硬盘。建议先装上硬盘再上电开机。
DS3000系列提供与DS4000系列类似的带内和带外两种管理方法,带外管理的默认IP地址也与DS4000一样,控制器A为192.168.128.101,控制器B为192.168.128.102。
本人比较喜欢采用带外管理,将本本网卡设至192.168.128网段后,可以ping通即可。管理口长时间未起用时需要若干分钟的时候等待管理接口工作。
在本本上安装DS3000 Storage Manager(随机附带),注意该SM与DS4000上的Storage Manager为不同程序,不可替换使用。甚至不能在一台机器上共存。
打开Storage Manager后,首先需要发现设备,可以ping通控制器后,发现工作会非常容易。
双击发现的设备就可以进入该设备的管理界面,学名叫Subsystem Management。
Subsystem Management分为5个大项,Summary,Configure,Modify,Tools,Support。
常规的操作这里不再详述,如果你装过DS4000产品,应该对配置方法不会感到陌生。
当然Storage Manager里只提供一些常规功能,在遇到问题的时候,比如需要重置手动清零时在该程序里无法完成的,所以与DS4000产品一样,提供了Script的方式,运行Script有两种方法。方法一:在DS3000 Storage Manager 的Enterprise Manager界面里右击单击所找到的设备,选择Execute Script。方法二,在c:\program files\IBM_ds3000\client\里找到smcli.exe程序,使用smcli ip-address -c "commandline"的方式执行。
DS3200和DS3400都会有单控和双控两种机型。如果您购买的是单控的型号,而在安装时发现系统有类似找不到第二个控制器的电池,冗余路径丢失的错误,那是由于未将系统设置成单控工作模式所引起的,遇到这种方法,可以在Execute Script窗口下键入:
set storageSubsystem redundancyMode=simplex
然后,选择Tools菜单下的Execute only来执行。
如果遇到需要重置系统设置的需要也可以在同样的窗口下执行:
clear storageSubsystem configuration / eventlog等。
当然如果大家有兴趣也可以进一步借助该系统了解一下更多的命令功能,相信会对进一步masting该设备有更好的帮助。
最后提供一些DS3000系列做配置时的注意事项:
1. 所有的3000系列产品,包括EXP3000、DS3200、DS3400使用时,至少配置4块硬盘才可使用
2. EXP3000只能与一台服务器连接,不能连接两台服务器,所以也不支持微软的双机MSCS
3. 与EXP3000连接的卡只能用MegaRAID PCI-e卡 (39R8850)
4. IBM system x3650自带的SAS接口是为连接SAS磁带机准备,不能与EXP3000连接。(理论上可以,但IBM不予支持)
5. 服务器与EXP3000的连接线为3m MegaRAID SAS Cable 39R6471
6. EXP3000与EXP3000扩展式的连线为SAS Cable 1m的39R6529和3m的39R6531,不可与MegaRAID线混用
7. 服务器与DS3200连接的卡只能用SAS HBA PCI-e 卡 25R8060,连接线是1m的39R6529与3m的39R6531
8. DS3200每个控制器上只带一个SAS主机端口,但通过一个SAS 2-Port Daughter Card 39R6509 可以使每个控制器增加至3个端口
9. DS3200默认带4分区license 不带flashcopy和volumecopy功能,要升级分区,flashcopy及volumecopy的功能需先购买39R6540 DS3200 Software Feature Pack,然后再购买相应的功能包,也就是说39R6540是购买后续升级功能的前提。
10. 服务器与DS3400的连接可以用任何标准的4Gb HBA卡,连接线就是标准的FC cable,但请注意在DS3400上需要选配4GB的SFP
11. DS3400每个控制器上带2个主机接口,没有扩充选择
12. DS3400默认带2分区License 不带flashcopy和volumecopy功能,要升级分区 flashcopy及volumecopy的功能需要先购买42C2143 DS3400 Software Feature Pack,然后再购买相应的功能包,也就是说42C2143是购买后续升级功能的前提,与DS3200的升级方法相同,但产品号不同。
方案组成:
本方案由IBM X3650服务器两台,DS3200磁盘柜一台,ROSE HA软件一套组成实现。
工作原理:
RoseHA双机系统的两台服务器(主机)都与磁盘阵列(共享存储)系统直接连接,用户的操作系统、应用软件和RoseHA高可用软件分别安装在两台主机的内部存储(硬盘)上,数据库等共享数据存放在存储系统上,两台主机之间通过私用心跳网络连接。系统主机开始工作后,RoseHA软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的RoseHA软件随时监控另一台主机的状态。当工作主机发生故障时,心跳信息就会产生变化,这种变化可以通过私用网络传递到备份机的RoseHA软件。之后,RoseHA就会控制系统进行服务切换,备份机启动和工作主机一样的应用程序,接管工作主机的工作(包括提供TCP/IP网络服务、文件共享、数据库等服务),并进行报警提示管理人员对故障主机进行维护。当维护完毕后,RoseHA可以自动或手动地将切换回原先的工作主机。也可以选择不切换,此时维修好的主机就作为备份机,双机系统继续工作。
解决方案优点:
l对服务器硬件配置要求不高,可以根据应用情况采用不同型号或配置。
l系统切换时间短,最大程度减少业务中断的影响。
l切换过程对应用程序无影响,无需重新启动或登录,做到无人值守。
l系统效率高,系统中数据读写、管理及容错由磁盘阵列来完成。而系统服务器故障监控切换处理由HA软件来完成。双机监控依靠RS232线路或专用100/1000M自适应网卡线路,既不占用主机CPU资源也不占用基础业务网络带宽,是RoseHA的特色功能,在实际的应用中得到用户的一致好评。
l支持丰富的应用配置,譬如:Oracle,SQLServer,Sybase,Exchange 等。
l硬件可采用机架式结构,便于维护管理。
组成双机热备的方案主要的三种方式分别为:基于共享存储(磁盘阵列)的方式,全冗余方式和复制方式。
基于共享存储(磁盘阵列)的方式
共享存储方式主要通过磁盘阵列提供切换后,对数据完整性和连续性的保障。用户数据一般会放在磁盘阵列上,当主机宕机后,备机继续从磁盘阵列上取得原有数据。如下图所示这种方式因为使用一台存储设备,往往被业内人士称为磁盘单点故障。但一般来讲存储的安全性较高。所以如果忽略存储设备故障的情况下,这种方式也是业内采用最多的热备方式。
全冗余方式
全冗余方式就是双机双存储,基于单台存储的传统双机热备方式,确实存在存储单点故障的情况,为实现存储冗余,存储高可用也已经越来越多的被用户接受。我们从理解上可以看出,双机热备最早是为解决服务器的计划性停机与非计划性宕机的解决方案,但是我们无法实现存储的计划性停机与非计划性宕机带来的服务器停机,而存储作为双机热备中唯一存储数据的设备,它一旦发生故障往往会造成双机热备系统全面崩溃。
随着科技的进步,云存储,云计算发展,对于存储热备已经进入了成熟及快速发展阶段,双机热备也随着技术的进步,进入到了没有单点故障的全冗余双机热备方式。如图:
这种方式的特点在于:
1、存储之间的数据复制不经过网络,而是由存储之间进行复制。
2、两个存储之间的复制是完全实时的,不存在任何时间延时。
3、主备存储之间的切换时间小于500ms,以确保系统存储时不产生延时。
4、硬盘盘符及分区不因为主备存储之间的切换而改变。
5、服务器的切换,不影响存储之间的初始化,增量同步及数据复制。
6、某一存储设备的计划性停机,不影响整个服务器双机热备系统的工作。
7、存储设备之间使用重复数据删除技术,完成增量同步工作。
8、真正的7X24小时或切换的全冗余方案。
复制方式
这种方式主要利用数据的同步方式,保证主备服务器的数据一致性。
基于数据复制的方式有多种方法,其性能和安全也不尽相同,其主要方法有以下几种:
A、单纯的文件方式的拷贝不适用于数据库等应用,因为打开的文件是不能被复制的,如果要复制必须将数据库关闭,这显然是不可以的。以文件方式的复制主要适用于WEB页的更新,FTP上传应用,对主备机数据完整性,连续性要求不高的情况下使用。
B、利用数据库所带有复制功能,比如SQLServer2000或2005所带的定阅复制,这种方式用户要根据自己的应用小心使用,原因主要是:
(1)SQLServer的定阅复制会在用户表上增加字段,对那些应用软件编程要求较高,如果在应用软件端书写时未明确指定字段的用户,而使用此功能会造成应用程序无法正常工作。
(2)数据滞留,这个限制怕也是最要命的,因为SQLServer在数据传输过程中数据并非实时的到达主备机,而是数据先写到主机,再写到备机,如此一来,备机的数据往往来不及更新,此时如果发生切换,备机的数据将不完整,也不连续,如果用户发现已写入的数据在备机找不到,重新写入的话,则主机修复后,就会发生主备机数据严重冲突,数据库会乱掉。
(3)复杂应用切莫使用定阅复制来做双机热备,包括数据结构中存储过程的处理,触发器和序列,一旦发生冲突,修改起来非常麻烦。
(4)服务器性能降低,对于大一点的数据库,SQLServer2000或2005所带的定阅复制会造成服务器数据库运行缓慢。
总之SQLServer2000或2005所带的定阅复制主要还是应用于数据快照服务,切莫用他来做双机热备中的数据同步。
C:硬盘数据拦截,目前国际国内,比较成熟的双机热备软件通常会使用硬盘数据拦截的技术,通常称为镜像软件即Mirror软件,这种技术当前已非常成熟,拦截的方式也不尽相同。
(1)分区拦截技术,以Pluswell热备份产品为例,他采用的是一种分区硬盘扇区拦截的技术,通过驱动级的拦截方式,将数据写往硬盘的数据提取,并首先写到备用服务器,以保证备用服务器的数据最新,然后再将数据回写到主机硬盘。这种方式将绝对保证,主备机数据库的数据完全一致,无论发生哪种切换,都能保证数据库的完整性与连续性。由于采用分区拦截技术,所以用户可以根据需要在一块硬盘上划分适合大小的分区来完成数据同步工作。
(2)硬盘拦截技术,以Symantec的Co-Standby为例,也是一种有效的硬盘拦截软件,他的拦截主要基于一整块硬盘,往往在硬盘初始化时需要消耗大量的时间。
双机热备中需要指出的几个概念
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)