从疫情处理标准化到DevOps交付标准化

    迪士尼的烟花不仅照亮了当时当地的市民游客,也点亮了上海的温度。张文宏在微博表示:“感谢今天不灭的烟火,让我们看到人类在灾难前面的从容淡定与对未来的信心。”

图片

    当下VUCA的疫情常态化,谁都不知道黑天鹅是怎么出现的,哪怕有了详细的流调、监控、隔离,在严格符合规范的情况下,迪士尼的万圣节差点成为了城市核心停转的导火索。

据杭州通报,10月29日,江西省上饶市铅山县占某某与同事杨某某一同乘坐G1382列车从上饶到上海。10月30日,2人乘坐K287列车从上海返回上饶。两人在乘坐K287列车时被告知是确诊病例的密切接触者,两人在得知后,立即报告了列车员。杭州市接到报告后,立即启动应急预案,进行核酸检测,并且全程闭环转运至定点医院。

从18点到晚上11点30分许,迪士尼园内游客接受核酸检测后基本离园完毕。据在现场的人士回忆,园内游客们非常冷静、理性,有序进行核酸检测后再按规定方式离开现场。

    有人说,上海每经历一次疫情,就出一套参考案例。还有人说,自己从未对上海的这种突发事件担心,因为他知道为了应对这一天,相关人员不知考虑过了多少预案。

    的确,没有强行隔离,也没有直接黄码,上海对待疫情的态度既谨慎小心又人性温暖。

    疫情常态化的背景下,如何高效抗疫又把对民众生活的影响降到最低,是让这个城市和经过这个城市的人们生活更美好一点的必然要求。这背后,是无数相关岗位工作人员日夜不休完成防控的所有标准程序的努力

图片

    我们常常说软件的复杂性在于需求的时效性及复杂性,而这一次疫情的管理给了我们DevOps落地提供很多的参考。

  1. 影响范围的确定。当杭州通知上海相关人员存在密接者时,上海立即对核心重叠区域迪士尼进行了隔离。如何快速评估需求影响的范围,并且进行隔离这不就是架构上的微服务和领域驱动希望做到的么?
  2. 不强行隔离和黄码。一旦黄码也就意味着所有在迪士尼的相关人员要进入漫长的隔离过程,而与黄码相关的家人也会进一步影响。如何在可控的风险下做局部定位及进一步的测试排查,避免过度的响应机制。从生产测试、监控获取问题,在没有爆发的基础上快速排查逻辑并且锁定模块,隔离流量完成局部灰度回滚。
  3. 快速的核酸采集及鉴定。仅仅12个小时不到迪士尼共计33863份相关人员核酸报告全部阴性。这里涉及到采集人员,设备的运输,采集过程的排队整理及后续相关工作,除了迪士尼,上海几个做核酸的医院也同样面临着突发的核酸检查需求。在突发情况下高效的反馈检验机制及规范性,让事件在一夜之间从紧张回到了平静,而去QA还是强QA是值得大家再想想的。
  4. 完善的周边配套。由于地铁站隔离,相关人员需要经过核酸后正常离园,市交通委安排了220辆临时接驳公交车至迪士尼西公交枢纽,转送迪士尼游客。在产生新的节点过程后,如何继续保持流程的通畅,接回标准流程,这样的完成定义是端到端的,而不是简单的卡口。
  5. 所有相关人员的积极、主动配合。对于很多没有被划在监测范围的市民也主动的去医院进行监测,避免后续影响工作,而这种怕麻烦别人的性格将质量内建的意识也体现了出来。仅仅通过结果反推查找范围仍然很难解决所有问题,如何在遇到问题的情况下进一步自查,避免问题遗漏。

    不是说软件复杂就做不好,而是从瀑布流程到工程化支撑再到管理能力都跟不上软件的变化,从而导致要么全局刹车,要么问题在扩散,表面很努力,实际效果并不好。
    上海这次所表现的管理能力,不是简单能够上个工具或者Copy一下流程就能做到的,而DevOps的实践不也是这样么?

12个小时一切回归平静,上海依旧正常运行!构建适应变化的“流畅、持续高质量交付用户价值”能力!
图片

声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/186869.html

(0)
联系我们
联系我们
分享本页
返回顶部