一般存在于服务器集群、多机并行时用的。
是服务器组各个机器之间传递信息用的。
比如故障转移集群服务器的心跳。集群网络是对外正常工作通讯的,心跳网络就是A\B机之间传递信息,相互验证对方是否还在正常运行用的。比如平时是A机在运行服务,A、B机之间会每隔一段时间通过心跳网询问对方是否还正常,如果A服务器宕机了,B得不到回应,就行把集群资源拿过来继续运行服务。
心跳线是用于连接A、B两台服务器间的网线。在这两台服务器A、B中,A为工作机,B为备份机,它们之间通过一根心跳线来连接。一般在服务器上都配有两块网卡,其中一块专门用于两台服务器(节点)间的通讯。安装在服务器上的软件通过心跳线来实时监测对方的运行状态。一旦正在工作的主机A因为各种硬件故障,如电源失效、主要部件失效或者启动盘失效等导致系统发生故障,心跳线会反映给互为备份的另外一台主机,主机B可以立即投入工作。这样可以在最大限度上保证网络的正常运行。这也称为“心跳检测”。心跳线主要利用一条RS-233检测链路来完成,采用Ping方式检测验证系统Down机检测的准确性。的检测,清除死连接,即使在没有数据来往的时候,TCP也就可以(在启动TCP这个功能的前提下)自动发包检测是否连接正常,这个不需要我们处理。服务端设计心跳包的目的:
探知对端应用是否存活,服务端客户端都可以发心跳包,一般都是客户端发送心跳包,服务端用于判断客户端是否在线,从而对服务端内存缓存数据进行清理(玩家下线等);问题在于,通过TCP四次握手断开的设定,我们也是可以通过Socket的read方法来判断TCP连接是否断开,从而做出相应的清理内存动作,那么为什么我们还需要使用客户端发送心跳包来判断呢?
第一种判断客户端是否在线策略:
直接监控TCP传输协议的返回值,通过返回值处理应用层的存活判断
比如在C++当中
使用poll的IO复用方法时:
if(fds[i].revents &POLLERR)
if(fds[i].events &POLLDHUP)
通过上述判断可以探知TCP连接的正确性从而在服务器也关闭对应的连接
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)