黑盒-blackbox_exporter

Github地址: https://github.com/prometheus/blackbox_exporter/tree/master

前提

已经拥有存在 prometheus 环境 这里:我已经拥有这个环境,存放目录在 /data

安装blackbox_exporter

具体可以监控哪些: tcp、icmp、http、post, 具体看 blackbox.yml 配置

wget https://github.com/prometheus/blackbox_exporter/releases/download/v0.16.0/blackbox_exporter-0.16.0.linux-amd64.tar.gz
tar -zxvf blackbox_exporter-0.16.0.linux-amd64.tar.gz -C /data
mv /data/blackbox_exporter-0.16.0.linux-amd64 /data/blackbox_exporter

cat > /usr/lib/systemd/system/blackbox_exporter.service << EOF
[Unit]
Description=blackbox_exporter
After=network.target 

[Service]
WorkingDirectory=/data/blackbox_exporter
ExecStart=/data/blackbox_exporter/blackbox_exporter \
         --config.file=/data/blackbox_exporter/blackbox.yml
[Install]
WantedBy=multi-user.target
EOF

systemctl daemon-reload && systemctl start blackbox_exporter && systemctl enable blackbox_exporter
ss -tunlp |grep 9115
# 可访问 ip:9115 查看

监控主机存活状态

注意: job_name 必须添加到 scrape_configs 下 labels -----> 打上标签 replacement ----> 黑盒服务地址

监控网站状态

监控主机端口存活状态

接口 post 请求状态检测

首先我们要改一下 post 相关接口的 blackbox.yml 配置,我们自己定义一个模块

如果主机上百个?

存放位置

ls /data/prometheus/rules/ icmp 存放文件: blackbox-icmp.yml http 存放文件: blackbox-http.yml tcp 存放文件: blackbox-tcp .yml

格式例如

告警规则

  • icmp、tcp、http、post 监测是否正常可以观察 probe_success 这一指标

  • probe_success == 0 # 连通性异常

  • probe_success == 1 # 连通性正常

  • 告警也是判断这个指标是否等于 0,如等于 0 则触发异常报警

定制告警规则

大屏显示Grafana

使用摸版编码为: 9965, 可以以此摸版为参考,自定义漂亮的摸版 <个人9965觉得不太好看> 更多摸版:https://grafana.com/grafana/dashboards

Last updated