黑盒-blackbox_exporter
Github地址: https://github.com/prometheus/blackbox_exporter/tree/master
前提
已经拥有存在 prometheus 环境 这里:我已经拥有这个环境,存放目录在 /data
安装blackbox_exporter
具体可以监控哪些: tcp、icmp、http、post, 具体看 blackbox.yml 配置
wget https://github.com/prometheus/blackbox_exporter/releases/download/v0.16.0/blackbox_exporter-0.16.0.linux-amd64.tar.gz
tar -zxvf blackbox_exporter-0.16.0.linux-amd64.tar.gz -C /data
mv /data/blackbox_exporter-0.16.0.linux-amd64 /data/blackbox_exporter
cat > /usr/lib/systemd/system/blackbox_exporter.service << EOF
[Unit]
Description=blackbox_exporter
After=network.target
[Service]
WorkingDirectory=/data/blackbox_exporter
ExecStart=/data/blackbox_exporter/blackbox_exporter \
--config.file=/data/blackbox_exporter/blackbox.yml
[Install]
WantedBy=multi-user.target
EOF
systemctl daemon-reload && systemctl start blackbox_exporter && systemctl enable blackbox_exporter
ss -tunlp |grep 9115
# 可访问 ip:9115 查看监控主机存活状态
注意: job_name 必须添加到 scrape_configs 下 labels -----> 打上标签 replacement ----> 黑盒服务地址
监控网站状态
监控主机端口存活状态
接口 post 请求状态检测
首先我们要改一下 post 相关接口的 blackbox.yml 配置,我们自己定义一个模块
如果主机上百个?
存放位置
ls /data/prometheus/rules/ icmp 存放文件: blackbox-icmp.yml http 存放文件: blackbox-http.yml tcp 存放文件: blackbox-tcp .yml
格式例如
告警规则
icmp、tcp、http、post 监测是否正常可以观察 probe_success 这一指标
probe_success == 0 # 连通性异常
probe_success == 1 # 连通性正常
告警也是判断这个指标是否等于 0,如等于 0 则触发异常报警
定制告警规则
大屏显示Grafana
使用摸版编码为: 9965, 可以以此摸版为参考,自定义漂亮的摸版 <个人9965觉得不太好看> 更多摸版:https://grafana.com/grafana/dashboards
Last updated