

运维开发故事
-
探索AI+k8s:如何使用Deepseek大模型增强k8s-dashboard
一、导读 Kubernetes(简称K8s)的普及让开发和运维工作变得更加高效,但它的复杂性却让许多人在使用时面临挑战。从网络配置到故障排查,每一步都需要深入的技术积累。然而,随着…
-
告警平台2.0——仿出强大
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。 在《告警平台1.0》中,我们实现了告警平台,可以实现纳管通过AlertManager推送的告警信息,然后进行灵活的告警通知发送…
-
使用DaemonSet实现heapdump文件自动化管理
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。一、引言1、为什么要获取heapdump文件heapdump文件是Java应用遭遇OOM后的诊断报告,记录了某一时刻 JVM 堆…
-
SRE 如何提升自己在团队中的影响力?
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com✍ 道路千万条,安全第一条。操…
-
2025年,SRE在企业中可以做哪些事
✍ 本文在AI的鼎立协作下完成。一、前言在当今时代,AI 浪潮正以汹涌之势席卷各行各业,深刻地改变着我们的生活与工作模式。从医疗领域的智能诊断,到金融行业的风险预测,AI 的身影无…
-
使用loki+promtail+alertmanager+prometheusAlert实现自定义日志采集查看和监控告警
后面介绍部署方式都是二进制部署,这些应用都可以使用容器进行部署,思路都是一样的,本文就不再介绍了 2.2 安装[root@testqwe ~]# mkdir loki[root@t…
-
KVM虚拟化之设备透传
显卡透传查看显卡PCI地址lspci | grep -i nvidia会看到类似下面的输出,其中包含显卡的 PCI 地址,例如 0000:03:00.0:03:00.0 VGA c…
-
[kubectl-resource-view]: 一款用于查看k8s资源使用情况的插件
1.简介一款自己编写的k8s 命令行插件,用于查看k8s node和pod资源的 cpu、 memory、 gpu的request 和limit 使用情况。 2.安装可直接解压下载…
-
服务器又被黑了,可咋办
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:jokerbai.com✍ 道路千万条,安全第一条。操作不规范…
-
告警平台V1.0版本
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com 监控无数,告警乱飞,历史难查…