HDFS集群中NameNode 存在单点故障问题,对于只有一个NameNode的集群,如果NameNode机器出现意外情况,将导致整个集群无法使用,直到NameNode 重新启动。
影响HDFS集群不可用主要包括以下两种情况:
NameNode机器宕机,将导致集群不可用,重启NameNode之后才可使用。
计划需要对NameNode节点软件或硬件升级,导致集群在短时间内不可用。
为了解决上述问题,Hadoop给出了HDFS的 高可用 HA方案:HDFS的HA通常由两个NameNode组成,一个处于 active 状态,另一个处于 standby 状态。Active NameNode对外提供服务,比如处理来自客户端的RPC请求,而Standby NameNode则不对外提供服务,仅同步Active NameNode的状态,以便能够在它失败时快速进行切换。而这里的快速切换是如何实现的呢?是通过zookeeper的 动态上线感知 来实现的。
简单介绍下zookeeper是什么?
ZooKeeper 顾名思义 动物园管理员 ,他是拿来管大象(Hadoop) 、 蜜蜂(Hive) 、 小猪(Pig) 的管理员, Apache Hbase和 Apache Solr 以及LinkedIn sensei 等项目中都采用到了 Zookeeper。ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,ZooKeeper是以Fast Paxos算法为基础,实现同步服务,配置维护和命名服务等分布式应用。这是zookeeper的官方介绍,对于程序原来说zookeeper在hadoop中的应用可以理解为是hadoop的整体监控系统,如果namenode宕机后,这时候Zookeeper 的重新选出leader。这是它最大的作用所在。
接下来看看zookeeper的 动态上线感知 图:
1、首先在hadoop中配置自动故障转移机制。
2、在配置HA的时候首先配置zookeeper集群,然后启动zookeeper集群。
3、在第一次启动hadoop的HA之前先初始化HA在zookeeper中的状态然后启动HA,在启动过程中会在各个NameNode节点上启动DFSZK Failover Controller,作用就是向zookeeper中注册服务器的信息,然后hadoop通过进程监控在zookeeper中的节点状态。
4、在zookeeper中注册的节点是临时节点,当服务器宕机下线的时候,zookeeper会把这个节点删除掉,这样才会产生事件,客户端(hadoop)才能监听到,然后hadoop将Standby NameNode转换为Active NameNode。
1、上线:指网络连接状态的改变,通常是指网络连接从断开到建立的过程,也就是将计算机连接到网络中。2、下线:指网络连接状态的改变,通常是指网络连接从建立到断开的过程,也就是将计算机从网络中断开。
3、合线:指将一台计算机和其他计算机或网络设备连接在一起,以便交换数据或信息的过程。
不是上线下线 而是上行下行一般ADSL上网方式上行与下行速率是不对称的,一般下行速率比较高
ADSL(Asymmetric Digital Subscriber Line)技术是一种不对称数字用户线实现宽带接入互连网的技术,ADSL作为一种传输层的技术,充分利用现有的铜线资源,在一对双绞线上提供上行640kbps(理论上行1Mbps)下行8Mbps的带宽,从而克服了传统用户在"最后一公里"的"瓶颈",实现了真正意义上的宽带接入。
上行速率一般是指从你的电脑上传的速度,也就说别人从你的电脑进行通讯的速率!
下行速率一般是你从网络上的主机下载速度!
一般ADSL上网方式上行与下行速率是不对称的,一般下行速率比较高!上行比较低!现在1M普通是上行:386Kb,下行:1024Kb! 2M上行:386Kb,下行:2048Kb
注意速率与实际速度是有区别的,一般需要除以8 ,因为1B=8b!
所以2M实际速度200K左右。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)