文章目录
- 前言
- 1.ubuntu安装prometheus实现监控部署
- 2.ubuntu安装alertmanager监控
- 3.在prometheus上配置alertmanagerg告警
- 4.安装cpolar实现随时随地开发
- 5.配置公网地址
- 6.保留固定公网地址
- 总结
前言
监控系统能够发现异常,但如果所有波动都立即触发通知,重复告警、短暂抖动和低优先级问题很快就会淹没真正重要的信息。时间久了,运维人员容易产生告警疲劳,关键故障反而可能被忽略。
Prometheus负责采集指标并根据规则判断异常,Alertmanager则负责接收告警,完成分组、去重、静默、抑制和通知路由。两者组合后,可以让同类告警集中发送,也能根据严重程度交给不同人员或不同渠道处理,使告警从“发现问题”进一步升级为“有序通知问题”。
这套方案适合服务器监控、应用可用性检查和中小型业务告警。通过cpolar为Prometheus管理页面建立公网访问地址后,管理员还可以在外部网络查看指标和告警状态。需要注意的是,远程查看页面和主动发送通知是两种不同能力,真正的邮件或即时通信提醒仍需在Alertmanager中配置对应通知渠道。
本文将带你从实战出发,一步步搭建一套可靠、智能、不扰民的告警体系,让你的监控系统真正成为守护业务的“哨兵”,而不是半夜的“闹钟”。
从此,安心睡觉,把告警交给 Alertmanager。
1.ubuntu安装prometheus实现监控部署
通过以下命令创建一个用于存放 Prometheus 的目录 /app:
mkdir/app进入到/app目录下:
cd/app从prometheus官网下载压缩文件:
下载适用于Linux系统的文件。
使用的是 MobaXterm_Personal,这是一种功能强大的终端工具,常用于远程连接 Linux 服务器。进入/app下面。点击上传,上传下载好的prometheus压缩文件。
解压缩该文件:
tar-xzvfprometheus-3.7.3.linux-amd64.tar.gz将解压好的文件夹改一个名字,并删除原有的未解压文件(可以不删):
mvprometheus-3.5.0.linux-amd64 prometheusrm-rfprometheus-3.5.0.linux-amd64.tar.gz进入解压好并且改过名的prometheus目录下,查看它的版本。返回版本号代表安装成功!
cd/app/prometheus ./prometheus--version创建prometheus 本地TSDB数据存储目录:
mkdir-p/var/lib/prometheus进入这个目录,使用systemctl管理Prometheus:
vim/usr/lib/systemd/system/prometheus.service写入:
[Unit]Description=PrometheusDocumentation=https://prometheus.io/After=network.target[Service]Type=simpleUser=rootExecStart=/app/prometheus/prometheus--config.file=/app/prometheus/prometheus.yml--storage.tsdb.path=/var/lib/prometheus --web.enable-lifecycleExecReload=/bin/kill-HUP$MAINPIDKillMode=processRestart=on-failure[Install]WantedBy=multi-user.targetsystemctl enable prometheus
将 Prometheus 服务设置为 开机自启动。
systemctl start prometheus
立即启动 Prometheus 服务。
systemctl status prometheus
查看 Prometheus 服务的 当前状态。
systemctlenableprometheus systemctl start prometheus systemctl status prometheus部署完成后,在浏览器中输入http://极空间IP:9090就能看到prometheus的界面啦:
2.ubuntu安装alertmanager监控
去官网下载安装文件:
找到linux版,下载:
下载完成后记住下载路径。
手动上传到/app下载好的alertmanager文件。
上传成功后解压:
tar-vxzfalertmanager-0.27.0.linux-amd64.tar.gz改名方便记忆:
mvalertmanager-0.27.0.linux-amd64 alertmanager将Altermanager配置为系统服务:
cd/usr/lib/systemd/systemvimalertmanager.service[Unit]Description=https://prometheus.io[Service]Restart=on-failureExecStart=/app/alertmanager--config.file=/app/alertmanager.yml[Install]WantedBy=multi-user.target加载system文件,启动alertmanager这个服务,并设置开机启动:
systemctl daemon-reload systemctl start alertmanager.service systemctlenablealertmanager.service也可以后台手动启动:
nohup./alertmanager--config.file=alertmanager.yml>>/app/alertmanager/alertmanager/alertmanager.out2>&1&catalertmanager.out启动成功后,访问Altermanager,ip+9093,默认端口为 9093。
3.在prometheus上配置alertmanagerg告警
进入prometheus的配置文件,加入alertmanager告警规则:
vi/app/prometheus/prometheus.ymlBash
加入以下内容后:Prometheus可以用localhost:9093访问到运行在本地9093端口的Alertmanager服务,从而抓取系统指标。
- targets:["localhost:9093"]labels: app:"alertmanager"Bash
这一步配置的作用是:告诉 Prometheus,当监控规则触发告警时,应该把告警信息发送到哪个 Alertmanager 服务进行处理(便于一会监控node_exporter,也可以监控mysqld_exporter等等)。
alerting: alertmanagers: - static_configs: - targets:["localhost:9093"]打开prometheus监控成功:
后续也可以配置告警规则。
但是目前我们只能在自己电脑上进行监控,倘若公司有一个紧急警报,我们能怎么做呢?接下来,cpolar就派上永场啦!
4.安装cpolar实现随时随地开发
cpolar 可以将你本地电脑中的服务(如 SSH、Web、数据库)映射到公网。即使你在家里或外出时,也可以通过公网地址连接回本地运行的开发环境。
❤️以下是安装cpolar步骤:
使用一键脚本安装命令:
sudocurlhttps://get.cpolar.sh|sh安装完成后,执行下方命令查看cpolar服务状态:(如图所示即为正常启动)
sudosystemctl status cpolarCpolar安装和成功启动服务后,在浏览器上输入虚拟机主机IP加9200端口即:【http://ip:9200】访问Cpolar管理界面,使用Cpolar官网注册的账号登录,登录后即可看到cpolar web 配置界面,接下来在web 界面配置即可:
打开浏览器访问本地9200端口,使用cpolar账户密码登录即可,登录后即可对隧道进行管理。
5.配置公网地址
登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理——创建隧道:
隧道名称:可自定义,本例使用了:prometheus,注意不要与已有的隧道名称重复
协议:http
本地地址:9090
域名类型:随机域名
地区:选择China Top
点击创建:
创建成功后,打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了公网地址,接下来就可以在其他电脑或者移动端设备(异地)上,使用地址访问。
访问成功。
6.保留固定公网地址
使用cpolar为其配置二级子域名,该地址为固定地址,不会随机变化。
点击左侧的预留,选择保留二级子域名,地区选择china top,然后设置一个二级子域名名称,我这里演示使用的是prometheus,大家可以自定义。填写备注信息,点击保留。
登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道prometheus,点击右侧的编辑。
修改隧道信息,将保留成功的二级子域名配置到隧道中
- 域名类型:选择二级子域名
- Sub Domain:填写保留成功的二级子域名
- 地区: China Top
点击更新
更新完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的二级子域名名称。
最后,我们使用固定的公网地址在任意设备的浏览器中访问,可以看到成功访问本地部署的prometheus页面,这样一个永久不会变化的二级子域名公网网址即设置好了。
这样,我们就可以随时随地监控,不用担心,在家无法监控设备!
总结
Prometheus与Alertmanager分别承担异常判断和告警管理,让监控信息不再以零散、重复的方式直接通知运维人员。合理设置持续时间、分组规则和严重级别后,可以减少短暂波动产生的误报,也能让关键故障更快到达对应负责人。
cpolar补充了Prometheus页面的异地访问能力,但公网开放后应增加认证和访问限制。告警系统是否真正有效,最终取决于阈值是否符合实际业务、通知是否分级,以及告警发生后是否具备明确的处理流程。