灰度发布

灰度发布,第1张

灰度发布又称金丝雀发布,起源是早起矿井工人发现金丝雀对瓦斯气体很敏感。因此旷工在下井之前都会先将一只金丝雀放到井中,如果金丝雀不叫了,就代表瓦斯浓度高。

度娘说的挺好的~

灰度发布开始后,先启动一个新版本应用,但是并不直接将流量切过来,而是测试人员对新版本进行线上测试,启动的这个新版本应用,就是我们的金丝雀。如果没有问题,那么可以将少量的用户流量导入到新版本上,然后再对新版本做运行状态观察,收集各种运行时数据,如果此时对新旧版本做各种数据对比,就是所谓的A/B测试。

当确认新版本运行良好后,再逐步将更多的流量导入到新版本上,在此期间,还可以不断地调整新旧两个版本的运行的服务器副本数量,以使得新版本能够承受越来越大的流量压力。直到将100%的流量都切换到新版本上,最后关闭剩下的老版本服务,完成灰度发布。

如果在灰度发布过程中(灰度期)发现了新版本有问题,就应该立即将流量切回老版本上,这样,就会将负面影响控制在最小范围内。

灰度发布是指在黑与白之间, 能够平滑过渡的一种发布方式. AB test就是一种灰度发布试. 让一部分用户继续使用A, 一部分用户开始使用B, 如果用户对B没有什么反对意见, 那么逐步扩大范围, 把所有用户都迁移到B上面来.

灰度发布可以保证整体系统的稳定, 在初始灰度的时候就可以发现,调整问题, 以保证其影响度.

灰度发布常见一般有三种方式:

本文主要讲解 根据Cookie和来路IP这两种方式来实现简单的灰度发布, Nginx+LUA 这种方式涉及内容太多就不再本文展开了.

根据 Cookie 查询 Cookie 键为 version 的值, 如果该 Cookie 值为 V1 , 则转发到 hilinux_01 , 为 V2 则转发到 hilinux_02 , Cookie 的值都不匹配的情况下, 默认走 hilinux_01 所对应的服务器.

两个服务器分别定义为:

在Nginx里面配置一个映射, $COOKIE_version 可以解析出 Cookie 里面的version字段, $group 是一个变量, {}里面是映射规则.

如果一个 version 为 V1 的用户来访问, $group 就等于 hilinux_01 。在 server 里面使用就会代理到 http://hilinux_01 上。 version 为 V2 的用户来访问, $group 就等于 hilinux_02 。在 server 里面使用就会代理到 http://hilinux_02 上。 Cookie 值都不匹配的情况下默认走 hilinux_01 所对应的服务器。

如果是内部IP,则反向代理到hilinux_02(预发布环境);如果不是则反向代理到hilinux_01(生产环境)。

如果你只有单台服务器,可以根据不同的IP设置不同的网站根目录来达到相同的目的。

到此最基本的实现灰度发布方法就讲解完了,如果要做更细粒度灰度发布可参考ABTestingGateway项目。

总结:

蓝绿发布、红黑发布、灰度发布和滚动发布组最终的目标都是避免因发布导致流量的丢失或服务不可用的问题

四种方式均可以做到平滑式升级,在升级过程中服务仍然保持服务的连续性,升级对外界是无感知的。那生产上选择哪种部署方法最合适呢?这取决于哪种方法最适合你的业务和技术需求。如果你们运维自动化能力储备不够,肯定是越简单越好,建议蓝绿发布,如果业务对用户依赖很强,建议灰度发布。如果是K8S平台,滚动更新是现成的方案,建议先直接使用。

蓝绿发布:两套环境交替升级,旧版本保留一定时间便于回滚。

红黑发布: 申请新环境,删除老版本

灰度发布:根据比例将老版本升级,例如80%用户访问是老版本,20%用户访问是新版本。

滚动发布:按批次停止老版本实例,启动新版本实例。

项目逻辑上分为AB组,在项目系统时,首先把A组从负载均衡中摘除,进行新版本的部署。B组仍然继续提供服务。

当A组升级完毕,负载均衡重新接入A组,再把B组从负载列表中摘除,进行新版本的部署。A组重新提供服务。

1.如果出问题,影响范围较小;

2.发布策略简单;

3.用户无感知,平滑过渡;

4.升级/回滚速度快。

1.需要准备正常业务使用资源的两倍以上服务器,防止升级期间单组无法承载业务突发;

2.短时间内浪费一定资源成本;

3.基础设施无改动,增大升级稳定性。

当前服务都运行在集群A上

在云上申请一个黑色集群 B,在 B 上部署新版本的服务; 等到 B 升级完成

最后一次性地把负载均衡全部指向 B,并把 A 集群从负载均衡列表中删除,并释放集群 A 中所有机器。

可以看到,与蓝绿部署相比,红黑部署只不过是充分利用了云计算的弹性伸缩优势,从而获得了两个收益:一是,简化了流程;二是,避免了在升级的过程中,由于只有一半的服务器提供服务,而可能导致的系统过载问题。

1.从LB摘掉灰度服务器,升级成功后再加入LB;

2.少量用户流量到新版本;

3.如果灰度服务器测试成功,升级剩余服务器。

1.保证整体系统稳定性,在初始灰度的时候就可以发现、调整问题,影响范围可控;

2.新功能逐步评估性能,稳定性和健康状况,如果出问题影响范围很小,相对用户体验也少;

3.用户无感知,平滑过渡。

自动化要求高

滚动发布是指每次只升级一个或多个服务,升级完成后加入生产环境,不断执行这个过程,直到集群中的全部旧版本升级新版本。

1.保证整体系统稳定性,在初始灰度的时候就可以发现、调整问题,影响范围可控;

2.新功能逐步评估性能,稳定性和健康状况,如果出问题影响范围很小,相对用户体验也少;

3.用户无感知,平滑过渡。

自动化要求高


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/296760.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-25
下一篇2023-04-25

发表评论

登录后才能评论

评论列表(0条)

    保存