Alertmanager 配置终极指南:从“邪道”到正规军
发布时间:2025-12-07 20:10:45 作者:玩站小弟
我要评论
Prometheus Operator 的 AlertmanagerConfig 死活不生效时,我选择了对加密配置下手...问题背景部署 Prometheus Operator 后,精心配置的 Ale
。
Prometheus Operator 的邪道 AlertmanagerConfig 死活不生效时,我选择了对加密配置下手...
问题背景
部署 Prometheus Operator 后 ,配置精心配置的终极指南正规 AlertmanagerConfig 资源死活不生效。在无数次调试无果后,邪道我决定绕过 Operator,香港云服务器配置直接对加密的终极指南正规默认配置动手——这是一条邪修之路,但效果立竿见影 !邪道
邪道方案:直捣黄龙
1.获取加密配置 复制kubectl get secret alertmanager-rancher-monitoring-alertmanager-generated \ -n cattle-monitoring-system -o yaml > secret.yaml1.2. 2.解密核心配置 复制# 安装 yq 工具 wget https://github.com/mikefarah/yq/releases/download/v4.25.1/yq_linux_amd64 -O /usr/local/bin/yq chmod +x /usr/local/bin/yq # 解密 alertmanager 配置 echo "$(yq eval .data."alertmanager.yaml.gz" secret.yaml)" | base64 -d | gzip -d > alertmanager.yaml # 解密模板文件 echo "$(yq eval .data."rancher_defaults.tmpl" secret.yaml)" | base64 -d > rancher_defaults.tmpl1.2.3.4.5.6.7. 3.魔改配置(QQ邮箱示例) 复制global: resolve_timeout: 5m smtp_smarthost: smtp.qq.com:465 smtp_from: xxxx@qq.com smtp_auth_username: xxxx@qq.com smtp_auth_password: xxxxxxx smtp_require_tls: false route: receiver: "k8s-alarm" group_by: [alertname] routes: - receiver: "null" matchers: - alertname = "Watchdog" group_wait: 30s group_interval: 5m repeat_interval: 12h receivers: - name: "k8s-alarm" email_configs: - to: test@gmail.cn send_resolved: true - name: "null" templates: - /etc/alertmanager/config/*.tmpl1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25. 4.重新加密并部署 复制# 压缩配置 gzip -c alertmanager.yaml > alertmanager.yaml.gz # Base64 编码 ALERTMANAGER_CONFIG=$(base64 -w0 alertmanager.yaml.gz) TEMPLATE_CONFIG=$(base64 -w0 rancher_defaults.tmpl) # 生成新 Secret yq eval ".data.\"alertmanager.yaml.gz\" = \"$ALERTMANAGER_CONFIG\" | .data.\"rancher_defaults.tmpl\" = \"$TEMPLATE_CONFIG\"" secret.yaml > updated-secret.yaml # 修改 Secret 名称 sed -i s/name: alertmanager-.*/name: alertmanager-main/ updated-secret.yaml # 应用配置 kubectl apply -f updated-secret.yaml -n cattle-monitoring-system1.2.3.4.5.6.7.8.9.10.11.12. 5.修改Alertmanager工作负载 复制# 修改 volumes 配置 volumes: - name: config-volume secret: secretName: alertmanager-main # 替换默认值1.2.3.4.5. 效果验证
图片
图片
图片
警告:此方案虽快但险,配置Operator 升级可能导致配置被覆盖!服务器租用终极指南正规
正规军方案:优雅之道
1.配置告警接收器和路由 复制# k8s-alarm.yaml apiVersion: monitoring.coreos.com/v1alpha1 kind: AlertmanagerConfig metadata: name: k8s-alarm namespace: test spec: receivers: - name: tialert webhookConfigs: - url: https://your-webhook-url sendResolved: true route: groupBy: [alertname] groupInterval: 5m groupWait: 30s matchers: - name: severity value: "warning|critical" regex: true receiver: tialert repeatInterval: 4h1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24. 2.配置静默路由 复制# null.yaml apiVersion: monitoring.coreos.com/v1alpha1 kind: AlertmanagerConfig metadata: name: silence-watchdog namespace: cattle-monitoring-system spec: receivers: - name: null-receiver route: matchers: - name: alertname value: "Watchdog" receiver: null-receiver1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16. 3.自定义告警规则 复制# app-alert.yaml apiVersion: monitoring.coreos.com/v1 kind: PrometheusRule metadata: name: app-backend-alerts namespace: test labels: prometheus: rancher-monitoring role: alert-rules spec: groups: - name: app-backend rules: - alert: HighRequestRate expr: | sum(rate(http_requests_total{ job="app-backend"}[5m])) by (service) > 100 for: 10m labels: severity: critical annotations: summary: "High request rate on 邪道{ { $labels.service }}" description: "Request rate is { { $value }} per second"1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.总结对比
图片
选择建议:调试阶段可用“邪道”快速验证,生产环境务必使用正规方案!配置
无论是终极指南正规“邪道”还是“正规军” ,最终目的建站模板邪道都是让告警系统稳定 、可靠、配置可控 。终极指南正规调试阶段 ,适当“走捷径”可以快速验证思路 ,亿华云但千万别让临时方案变成长期债务。真正的运维高手 ,不是不走捷径 ,而是模板下载知道什么时候该回头 ,把“邪修”的经验,沉淀为“正道”的规范。
免费模板相关文章
2023年,自斯诺登事件以来全球CISO首次面临预算增速放缓甚至缩减。一方面,网络安全威胁和企业数字化转型业务安全保障需求不断增长;另一方面,CISO需要“平地抠饼”、降本增效,根据IANS2025-12-07
苹果 M3 Ultra 芯片规格曝光:最高 32 核 CPU、80 核 GPU
8 月 14 日消息,据彭博社记者马克・古尔曼Mark Gurman)在其《Power On》新闻通讯中报道,苹果公司计划在 2024 年推出一款高端的 M3 Ultra 芯片,该芯片将为 Mac S2025-12-07
数据中心是推动各种活动的无形动力,从手机银行和社交媒体更新等日常任务到人工智能AI)和沉浸式游戏体验等开创性技术。数据中心管理的格局不断变化,需要不断适应新兴趋势。在技术进步、不断变化的商业环境和不断2025-12-07
近年来,数据中心行业经历了巨大的增长和转型。2015年至2021年间,全球互联网流量增长了440%,随着全球经济数字化转型的推进,对数据中心的需求将继续增长。新加坡已成为亚洲设施的主要枢纽,为该地区吸2025-12-07
此前,Akamai 的安全研究员披露了 KmsdBot 僵尸网络,该僵尸网络主要通过 SSH 爆破与弱口令进行传播。在对该僵尸网络的持续跟踪中,研究人员发现了一些有趣的事情。C&C 控制对恶意2025-12-07
许多安卓智能手机和平板电脑的用户,如果想转让旧设备,或是将手机送给亲戚朋友,或是在安卓手机被盗取的情况下,会采用(远程)重置的手段,让安卓设备回到出厂状态。用户一般认为,重置之后,自己的所有隐私数据都2025-12-07

最新评论