ChAP - Netflix Chaos 自动化平台

查看原文

ChAP 是 Netflix 的 Chaos 自动化平台,用于从服务级别提供像 混乱猴子(Chaos Monkey) 之类的功能。他们仍然将试验放在 Production 上做,当然,不会影响到用户体验。这意味着他们需要权衡风险和到底试验能得到多大的成果。在 ChAP 这个平台上可以写一个任务,然后平台会切一部分流量均匀分布到一个可控的集群上做实验。他们设定了一个断路器,当试验超过了错误阈值,就会自动停止试验。有了这样的系统,就很容易做 Canary Analysis 了,在滚动部署的时候,就能预先发现问题。例如,评分系统要上线,切 0.5% 的流量到上线的金丝雀环境,这也意味着几乎 100% 的功能都会被测试到。