简介
目前线上很多应用都是使用prometheus进行监控。之前是使用smokeping做网络监控,但是,主机一多就容易丢失监控数据,就想着直接使用prometheus进行监控。
exporter
prometheus 拉取数据数据需要有对应的exporter,github上查了一下,有一个fping-exporter(schweikert/fping-exporter)比较适合。
这个exporter是用Go写的,直接git clone下载下来进行编译就可以运行了。
命令参数
fping-exporter [OPTIONS]
Application Options:
-l, --listen=[HOST]:PORT ? Listen address (default: :9605)
-p, --period=SECS ? ? ? ? ? Period in seconds, should match Prometheus scrape interval (default: 60)
-f, --fping=PATH ? ? ? ? ? Fping binary path (default: /usr/bin/fping)
-c, --count=N ? ? ? ? ? ? ? Number of pings to send at each period (default: 20)
?
Help Options:
-h, --help ? ? ? ? ? ? ? ? Show this help message
这里可以看到,其实需要系统安装fping命令,然后将fping执行程序指定给程序。
部署fping-exporter
我这边使用的CentOS7进行部署,所以可以直接使用yum安装epel-release,然后在epel源里面就有fping。
yum -y install epel-release
yum -y install fping
将编译好的二进制文件拷贝到
/data/prometheus/fping-exporter,添加systemd服务文件
vim /usr/lib/systemd/system/fping-exporter.service
[Unit]
Description=fping-exporter
After=network.target
?
[Service]
Type=simple
WorkingDirectory=/data/prometheus/
ExecStart=/data/prometheus/fping-exporter -f /usr/sbin/fping -p 60 -c 10 -l :9605 ?
LimitNOFILE=65536
PrivateTmp=true
RestartSec=2
StartLimitInterval=0
Restart=always
?
[Install]
WantedBy=multi-user.target
?
启动并设置开机启动
systemctl daemon-reload
systemctl enable fping-exporter
systemctl start fping-exporter
配置
在prometheus添加一个job监听目录,我们就可以在目录底下添加内容,实现动态加载了。
vim prometheus.yml
...
- job_name: fping_default
? metrics_path: /probe
? scrape_interval: 60s
? file_sd_configs:
? - refresh_interval: 61s
? ? files:
? ? ? - ?/data/prometheus/fping/*.json
? relabel_configs:
? - source_labels: [__address__]
? ? target_label: __param_target
? - source_labels: [__param_target]
? ? target_label: instance
? - target_label: __address__
? ? replacement: 192.168.1.8:9605
replacement: 192.168.1.8:9605 这个就是我们fping-exporter的地址,
重载一些prometheus进程,配置就生效了。
kill ? -HUP [pid]
配置监控项
mkdir -p /data/prometheus/fping
vim /data/prometheus/fping/host.json
[
? ? {
? ? ? ?"targets": [
? ? ? ? ? ?"10.0.4.2"
? ? ? ],
? ? ? ?"labels": {
? ? ? ? ? ?"instance": "10.0.4.2",
? ? ? ? ? ?"job": "fping_exporter"
? ? ? }
? },
? {
? ? ? ?"targets": [
? ? ? ? ? ?"10.0.4.3"
? ? ? ],
? ? ? ?"labels": {
? ? ? ? ? ?"instance": "10.0.4.3",
? ? ? ? ? ?"job": "fping_exporter"
? ? ? }
? }
]
这个项目上面就有提供了grafana面板,可以直接导入到grafana里面就可以看到监控数据了。
总结
这个fping-exportere有一个问题,如果监控主机有很多的时候,它都会拼凑在一个命令里面去执行,导致有时候监控数据获取不到。
在github上Fork了一个代码进行了修改(Jalright/fping-exporter),如果监控对象比较多,可以使用这个进行编译部署。