背景
最近在准备早会的时候,一直在想如何在十几分钟有限时间内分享点轻松、新鲜、可解决工作痛点的意见和想法,当然最重要的是这些意见和想法还能够在近期或接下来的时间可落地。
如果你觉得这很困难,这可能说明你平时缺少运维工作内容的梳理与总结,因此你就不知道以下几点:
- 近期哪项工作一直拖着未处理;
- 对于未处理的工作,它们的优先级与紧急程度如何;
- 对于未处理的工作,有没有自动化手段可解决;
- 对于未处理的工作,是否需要流程规范配合自动化手段;
- 等等
基于以上运维过程中的碎片化工作进行梳理与总结,就形成了我们自动化运维的依据,我们后续的工作才会更有价值。
突发奇想
随着又一季度工作的结束,在梳理季度工作时,我突然意识到:早会为什么不分享下我们的运维自动化的成果呢?
以下几个理由成功的说服了我自己:
- 既然我无论在日常工作中或是在公众号文章中都一直不断的推进与介绍运维自动化的建设,那么运维自动化最终给我们带来什么?
- 运维自动化工作的推进不是自己单打独斗就能完成的,需要整个团队密切合作、领导的强力支持、流程规范等的强力支撑,我们为何不通过运维自动化成果的介绍,让团队更加有信心?
正是基于上述两个理由,更加坚定了本次运维自动化成果的展示与分享!
Pipeline支撑运维自动化
为了让大家更好的将成果与我们所作的运维自动化工作进行关联,我将本次运维自动化的核心思想Pipeline支撑运维自动化
的规划进行展示:
成果展示
1.基础设施管理
我们通过CMDB将IDC机房基础设施进行了纳管,如网络设备、服务器、安全设备、机柜等,自动化手段+流程支持+团队密切配合,在一定程度上实现了基础设施上线的闭环处理。
2.运维效能
运维效能是指通过原子模型的流水线编排实现一定场景的自动化交付工作。基于这些自动化的工作,给运维工作的效率和效能数据提供了数据支撑。
- 「服务器上架」
通过服务器自动上架流水线,在实现分钟级上线、提高工作效率的同时也可以很轻松的将上线的数据进行图表展示,为后续的汇报工作提供可靠的数据分析。
- 「应用自动上线」
应用自动上线可以将新应用的上线时间从小时级提升到分钟级,而且要做到和监控进行联动,以免出现监控漏洞。这需要一套比较完善的配置管理规范和监控管理规范。
- 「sftp账户创建」
在不考虑sftp账户的安全隔离、高可用以及账户分离的情况下,建一个sftp账户分分钟搞定。但是当考虑到上述条件时,花费的时间可能需要几十分钟,还需要多方面验证。那么通过一套sftp管理规范+流水线实现秒级创建,不知你是否会动心!
- 其他效能数据
3.故障自愈
故障自愈作为智能运维的一部分,我们虽然还有很长一段路要走,但是我们还是有一定产出的。为了避免不必要的加班以及夜间告警,我们将部分监控接入故障自愈,到目前为止可至少节省我们1个小时的时间。
总结
通过本次早会的分享,不知对我们团队还是公众号前的你是否有所启发,但是对我来说却是收获满满:
- 随着运维自动化的逐渐展开,对于粗放型运维向精细化运维的转型愈来愈强烈,这就要求我们更加全面细致的思考问题;
- 在运维自动化初步完成后,我们还需要向效率看齐,即需要进行速度方面的优化;
- 在DevOps中有研发效能,如今放到运维自动化中,我们也需要重视下运维效能,运维也要理直气壮的用数据说话!
1.运维思索系列
2.运维管理系列
3.运维监控之路
4.蓝鲸之路
5.CI/CD之路
6.Ansible之路
札记:今天,懂你最想说的那句话:我爱你,中国。
喜欢这篇文章,记得点赞+在看哦~
声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/164586.html