要说最近几天最大的科技热点,非杭州云栖大会莫属。大会正在火热进行中,而在9月20日的现场,却发生了一件“意外”:支付宝工程师们居然切断了支付宝近50%的服务器!

原来,这是由支付宝工程师策划的一次特别技术演练。在ATEC主论坛现场,蚂蚁金服副CTO胡喜的一声号令下,支付宝近半的服务器被切断,而仅仅约26秒后,支付宝就完全恢复了正常。

支付宝工程师又调皮,云栖大会现场居然“剪”断网线!

这是如何做到的?在秒数级恢复正常的背后,离不开支付宝的机房架构——“三地五中心”,顾名思义,即在在三座城市部署五个机房。一旦其中一个或两个机房发生故障,支付宝的底层技术系统会将故障城市的流量全部切换到运行正常的机房,并能做到数据保持一致且零丢失。

支付宝工程师又调皮,云栖大会现场居然“剪”断网线!

这个架构有多厉害?它区别于目前互联网和金融科技行业普遍流行的“两地三中心”模式,但差别又绝不仅仅是多设立了两个机房那么简单。总而言之,它考验的是一家公司分布式架构、数据库、中间件及相关金融核心技术的能力。

而这,正是支付宝创立前十年修炼技术内功的结果。胡喜还强调说:“支付宝的技术目标之一就是保证金融级别的系统稳定和安全能力。”

在云栖大会的现场演练中,支付宝开启、观众参与体验的虚拟体验账号有数千个,这与真实环境下发生的“机房断网”并不具可比性。胡喜告诉大家,在真实环境下,如果支付宝部署在两个城市的两个机房同时出问题,跑在这两个机房上的支付宝账户恢复正常的速度是分钟级。

支付宝工程师又调皮,云栖大会现场居然“剪”断网线!

而专业数据告诉我们,两个城市多个机房同时故障的概率大概是亿分之一。由此可见,尽管概率极小,但支付宝工程师们作为维护系统安全、稳定的一线战士,一点风险也不放过,相当一丝不苟啊!

支付宝工程师又调皮,云栖大会现场居然“剪”断网线!

相关文章