运维开发故事
-
[kubectl-resource-view]: 一款用于查看k8s资源使用情况的插件
1.简介一款自己编写的k8s 命令行插件,用于查看k8s node和pod资源的 cpu、 memory、 gpu的request 和limit 使用情况。 2.安装可直接解压下载…
-
服务器又被黑了,可咋办
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:jokerbai.com✍ 道路千万条,安全第一条。操作不规范…
-
告警平台V1.0版本
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com 监控无数,告警乱飞,历史难查…
-
[Ansible专栏]Ansible安装和基本使用 (文末送书)
一、Ansible安装 Ansible的安装方法主要有以下三种: 1.1 yum使用EPEL源安装 1.2 编译安装 1.3 Git 源码安装 1.4 pip安装 二、Ansibl…
-
急速Boost,让数据跑得更快 — Ceph缓存技术全解析
在 Ceph 分布式存储系统中,缓存池(cache pool)是一种特殊的存储池,用于提升数据访问速度。缓存池通常用于将热点数据(frequently accessed data)…
-
Kubernetes场景下基于Nvidia GPU Operator 实现图形渲染能力
背景 现需要在Kubernetes平台上以容器的形态部署业务程序,借助NVIDIA 开源的GPU-operator组件来实现GPU显卡的调度和渲染能力。方案简介 通过在Kubern…
-
Kubernets的NVIDIA设备插件安装方案实践
环境:centos7 kubernetes版本:1.24 前言:这两天在搞大模型服务,之前也没了解过GPU相关的服务,因此整理了一个关于如何能够使用gpu节点文档。 1、现象本来服…
-
ceph配置缓存池
在 Ceph 分布式存储系统中,缓存池(cache pool)是一种特殊的存储池,用于提升数据访问速度。缓存池通常用于将热点数据(frequently accessed data)…
-
Kubernetes中的事件收集以及监控告警
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.comKubernetes中的事件监…
-
JVM 性能调优之通过 JProfile 和 JFR 分析系统瓶颈提升系统性能
生成 jfr JDK飞行记录器(JFR)是一种结构化日志记录工具, 它记录广泛的系统级(system-level)事件。类似于飞机上的黑盒子,它会持续记录飞行数据,用于调查飞行事故…