混沌工程中如何控制爆炸半径
在数字化时代,IT系统成为业务发展的主要载体,其可靠性直接影响业务的可持续性。随着系统架构逐渐向微服务架构演化、开发效率以及系统扩展性的答复提高,系统的复杂性随之增长。传统的测试方法已经不能全面覆盖系统所有的行为,测试的有效性也随之大打折扣。
为了保障系统稳定运行,很多企业都上了“容灾方案”以及各种“监控告警手段”。但都是“被动响应”,并且没有任何一个团队或个人,可以保障自己的“容灾方案”、“监控告警手段”在任何情况下都能够正常生效。同时,业务规模的不断增长使得服务之间的依赖性带来的不确定性也呈指数级增长...