经查阅北京铜牛信息科技股份有限公司资料显示,3月,公司天坛数据中心二期机房扩建工程启动,于2014年10月正式投入运营。
铜牛天坛机房是由国企上市公司铜牛集团的下属子公司铜牛信息投资建设,机房所在物业名称为铜牛信息大厦。
这就太多了。目前北京的IDC机房大部分应该都是BGP多线机房了,只有很少是单线机房。不管有多少机房,选择适合自己业务内容的才是最好的,性价比最高的。推荐一所北京双线机房:北京铜牛机机房。铜牛机房是铜牛集团的子公司铜牛信息投资兴建的,国企上市公司,在机房品质方面更有保障。天坛机房是铜牛机房的旗舰机房产品,是由有电信、联通、移动和教育网四大运营商线路组成。电信、联通、移动每个运营商各有两条不同的上联链路,使同一运营商之间形成备,一条链路中断,备用链路启用,保障用户访问不中断。这就充分体现出机房的经济实力。另外天坛机房采用先进的BGP路由聚合策略,可以在不同运营商之间形成备份。
目前生产环境RabbitMQ集群分布在铜牛机房和马驹桥机房,其中铜牛机房两个节点,马驹桥机房两个节点;
当铜牛和马驹桥机房之间网络中断或者有较大波动时,RabbitMQ集群会发生网络分区(脑裂),分成两个分区,当网络恢复时,网络分区的状态还是会保持,除非采取一些措施去解决,造成消息消费异常等问题。
处理网络分区的方式有两种:
1.手动处理网络分区:挑选一个信任的分区,重启其他分区的节点;
2.自动处理网络分区
RabbitMQ提供了4种处理网络分区的方式,在rabbitmq.config中配置cluster_partition_handling参数即可,分别为:ignore、pause_minority、pause_if_all_down、autoheal
经过对比,采用pause_minority方式比较符合当前场景,以下使用这种方案进行测试。
1、未加策略前,集群状态正常;
2、添加iptables策略,模拟网络中断;
网络中断后RabbitMQ服务端口还存在(同机房还可以进行读写);
3、关闭iptables策略,检查集群状态,发现集群已经分成两个分区;
重启节点rabbit@sz-145-centos178后集群状态恢复正常。
4、修改/etc/rabbitmq/rabbitmq.config配置文件,添加pause_minority策略;
5、逐一重启所有节点,重启过程中集群状态正常;
重启完成后再次添加iptables策略,模拟网络中断;可以发现添加策略后网络中断时MQ节点检测到自身属于少数节点,所以关闭自身节点,不提供服务;
6、关闭iptables策略,可以看到该节点RabbitMQ服务自动启动,集群状态也正常;
https://www.e-learn.cn/topic/2511682
https://www.cnblogs.com/ybyn/p/14343717.html
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)