

运维开发故事
-
Jenkins授权卡?试试我的方法
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。使用过 Jenkins 的应该都用过 Role Strategy plugin 来管理用户/组的权限管理,不是说它有多好用,而是…
-
K8s中明明配置了HPA,但是没扩容
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。Kubernetes 的 Horizontal Pod Autoscaler(HPA)是一种根据观察到的 CPU 利用率或其他自…
-
开发 Operator 调度 GPU 实例资源池
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:https://jokerbai.com ✍ 道路千万条,安全…
-
山洪灾害后的 Ceph 惨案:PG incomplete 到 RBD 镜像消失
!! 大家好,我是wanger,一个爱折腾的运维工程师。作者:wanger公众号:运维开发故事博客:https://devopstory.cn 背景在一次山洪灾害后,机房的服务器全…
-
一次CentOS7 glibc灾难的全链路修复
背景有一台Centos 7的服务器执行系统命令提示GLIBC的错误,在后来排查中发现是有更新过系统,系统中同时存在centos7和centos8的包导致系统库损坏,这台服务器上安装…
-
Elasticsearch 知识点全景整理(面试 & 学习指南)
🚀 无论是求职面试,还是日常工作中的搜索、日志分析和监控系统,Elasticsearch 都是绕不开的技术点。本文从 原理、架构、查询、调优、运维、安全与实践 …
-
AIOps系列 | 开发 K8s GPT 故障诊断工具
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。 前面我们介绍了 《开发 K8s Chat 命令行工具》,实现了通过和 Kubernetes 进行交互的方式进行运维,虽然文章中…
-
AIOps系列 | 开发一个 K8s Chat 命令行工具
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。 在前面我们介绍了[[03.大模型入门实战]]和 [[04.Agent入门实战]],了解了 AI 开发的基本流程,本章节我们将使…
-
深夜水文,我是如何搭建博客的
熟悉我的朋友或者关注《运维开发故事》公众号的朋友都知道我喜欢写作,时常在公众号上发布分章,除此之外呢,我对博客也挺感兴趣。2018年,第一次搭建博客,那时候用的是 word pre…
-
AIOps系列 | Agent 入门实战
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。最近在学习《AIOps》相关的知识课程,为了让学习有一定的收获,所以将其进行了总结分享,如果你恰好也需要,很荣幸能帮到你。上个章…