当前位置: 首页
系统平台
Prometheus监控系统安装与配置步骤详解

Prometheus监控系统安装与配置步骤详解

热心网友 时间:2026-05-17
转载

对于初次接触Prometheus监控系统的用户而言,一个常见的误区是寻找“如何安装Prometheus”的教程。实际上,Prometheus的设计理念与传统软件不同,它无需复杂的安装过程。其核心是一个独立的可执行二进制文件,因此部署的关键步骤在于获取程序包、进行配置并启动服务。所谓的“部署”,本质上是正确配置核心的 prometheus.yml 文件,并确保Prometheus进程能够以可靠、持久化的方式运行。

Linux怎么安装Prometheus监控 Linux时序数据库部署详解

快速验证:先确保核心功能正常

在着手配置systemd服务或调整复杂权限之前,建议采用一个更高效的策略:使用最简化的方式,优先验证Prometheus的核心采集与展示功能是否正常。这有助于快速排除环境问题,避免在错误的配置方向上耗费时间。

  • 获取软件包:从官方GitHub Releases页面下载对应系统架构的最新稳定版本。例如,对于Linux amd64系统,可使用命令:wget https://github.com/prometheus/prometheus/releases/download/v2.47.2/prometheus-2.47.2.linux-amd64.tar.gz
  • 解压并进入目录:执行 tar -xzf prometheus-*.tar.gz && cd prometheus-*/ 进入解压后的工作目录。
  • 直接启动测试:解压目录中已包含一个默认的 prometheus.yml 配置文件,其中配置了Prometheus对自身的监控。直接在终端前台启动:./prometheus --config.file=prometheus.yml --web.listen-address=":9090"
  • 关键验证点:打开浏览器,访问 http://<你的服务器IP地址>:9090,然后导航至 Status → Targets 页面。如果看到 prometheus 这个Job下的实例状态显示为 UP,则表明Prometheus已成功启动并开始采集自身指标数据。

若此步骤失败,90%以上的原因可归结为以下几点:9090端口被占用(可使用 netstat -tunlp | grep :9090 命令检查)、配置文件YAML语法或缩进错误(YAML对格式非常敏感)、或当前运行用户缺乏读取配置文件的权限

Systemd服务报“Permission Denied”错误的根本原因

许多用户倾向于使用systemd来管理Prometheus服务以实现开机自启,但常会遇到启动失败并提示权限拒绝的问题。这通常源于服务运行用户与文件路径权限的不匹配。

一个典型的场景是:用户将Prometheus的二进制文件和配置文件放置在 /root/ 目录或某个个人用户的家目录下,但在systemd服务单元文件中,却指定了以非root的专用用户(例如新建的 prometheus 用户)来运行此服务。该用户显然没有权限访问root用户的目录。

  • 统一部署路径:应将所有运行所需的文件(二进制程序、配置文件、数据存储目录)放置在系统级的公共路径下,例如 /usr/local/prometheus//opt/prometheus/
  • 正确设置权限:使用命令 chown -R prometheus:prometheus /usr/local/prometheus,将整个目录的所有权赋予给 prometheus 用户及其所属用户组。
  • 检查服务文件:仔细核对systemd服务文件(如 prometheus.service)中的 ExecStart= 指令,此处必须填写二进制文件的绝对路径,例如 /usr/local/prometheus/prometheus,而不能仅写 prometheus
  • 注意数据目录权限:如果通过 --storage.tsdb.path 参数指定了自定义的数据存储路径,务必确保该路径的权限也归属于 prometheus 用户。否则,服务可能在首次尝试写入时序数据库时失败并静默退出,给问题排查带来困难。

Targets配置:为何配置localhost:9100却无法采集数据?

这是新手在配置监控目标时最高频遇到的问题。关键在于理解:prometheus.ymlscrape_configs 下的 targets 地址,是从Prometheus服务器自身的网络视角进行解析和访问的。

举例说明:假设你在服务器A上部署了Prometheus,希望监控服务器B上运行的 node_exporter。如果在配置中写成 targets: ['localhost:9100'],那么Prometheus会尝试连接它自己(即A服务器)的9100端口,而非B服务器的。这必然导致采集失败。

  • 正确配置方法:应填写目标服务器的真实IP地址或可在Prometheus服务器上解析的主机名,例如 targets: ['192.168.1.26:9100']
  • 确保网络连通性:确认目标服务器的防火墙规则已放行9100端口(可使用 ufw allow 9100firewall-cmd --add-port=9100/tcp --permanent 等命令)。
  • 两步排查法
    1. 在目标服务器B上执行 curl http://localhost:9100/metrics,确认 node_exporter 服务本身运行正常,能够返回指标数据。
    2. 在Prometheus服务器A上执行 curl http://192.168.1.26:9100/metrics,验证从监控端到被监控端的网络连通性。如果此步骤失败,则问题在于网络或目标服务可达性,而非Prometheus配置本身。
  • 采集间隔生效:注意 scrape_interval 参数默认值为1分钟。修改此配置后,需要重启Prometheus服务才能使新的采集间隔生效。

控制数据增长:TSDB存储目录膨胀过快的解决方案

Prometheus默认会永久保存所有采集到的时序数据,这在生产环境中显然不可行,磁盘空间迟早会被耗尽。控制数据保留周期的关键配置并不在主配置文件 prometheus.yml 中,而是通过Prometheus的启动参数来设定。

  • 核心保留参数:通过添加启动参数 --storage.tsdb.retention.time=30d 来设置数据的保留时长(支持 d(天)、w(周)、y(年)等单位)。这是最常用且推荐的方式。
  • 避免使用废弃参数:切勿使用已被废弃的参数,例如 --storage.local.retention(该参数在v2.0及以上版本中已被移除)。
  • 关于WAL日志:如果启用了预写日志(WAL),其大小主要由内存和写入负载决定,没有直接的配置上限。但只要上述 retention.time 设置合理,过期的WAL文件会在后续的数据块压缩与清理过程中被自动删除。
  • 注意版本差异:执行 prometheus --version 确认你的版本。不同大版本的行为可能存在差异,例如从v3.x版本开始,引入了 --storage.tsdb.retention.size 参数,允许直接限制TSDB占用的磁盘空间大小。

另一个常见的误解是:设置的数据保留时间到期后,Prometheus不会立即执行删除操作。它会等待下一个预定的压缩周期(默认约为2小时)才清理过期数据。因此,在调整保留时间后,如果发现磁盘空间没有立刻释放,请勿认为配置未生效,只需给予系统一定的处理时间即可。

来源:https://www.php.cn/faq/2439254.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
统信UOS多桌面设置教程 工作区切换与管理技巧

统信UOS多桌面设置教程 工作区切换与管理技巧

在使用统信UOS操作系统时,如果感觉所有应用窗口都堆积在单一桌面上,导致任务切换效率低下,很可能是因为您尚未充分利用其内置的“工作区”功能。这一功能相当于为您的计算机创建了多个独立的虚拟桌面,每个桌面都可以承载一组特定的任务或项目,从而实现工作流的清晰分隔与高效管理。接下来,我们将系统性地介绍如何启

时间:2026-05-17 14:06
统信UOS系统内置邮箱客户端配置与使用教程

统信UOS系统内置邮箱客户端配置与使用教程

在统信UOS桌面专业版上使用内置的【统信邮箱】客户端时,如果遇到无法收发邮件的情况,先别急着怀疑系统。这通常不是软件本身的问题,而是因为几个关键配置环节容易被忽略:邮箱类型识别有偏差、没有使用授权码,或者服务器参数需要手动指定。下面这份详细的配置指南,能帮你一步步打通收发链路。 一、启动并进入邮箱客

时间:2026-05-17 14:05
Mac开启Apache服务器教程 苹果电脑内置Web服务配置指南

Mac开启Apache服务器教程 苹果电脑内置Web服务配置指南

想在macOS上快速搭建本地Web开发环境?无需安装任何第三方软件,系统内置的Apache服务器即可直接启用。只需在终端输入一行命令,访问localhost看到“It works!”提示,服务就已成功运行。默认网站根目录位于 Library WebServer Documents ,放入HTML文

时间:2026-05-17 14:05
银河麒麟系统查看无线网卡型号与驱动兼容性排查指南

银河麒麟系统查看无线网卡型号与驱动兼容性排查指南

在麒麟系统中排查无线网卡兼容性问题,需先识别硬件型号:PCIe网卡使用lspci查看设备ID与驱动状态,USB网卡通过lsusb获取VID PID信息。可借助dmesg日志检查驱动加载与固件错误,或使用lshw获取详细设备报告。最后,将芯片型号与麒麟生态官网兼容性列表比对,依据官方标注的兼容等级判断支持情况。

时间:2026-05-17 14:04
银河麒麟系统开启SSH服务与远程连接配置教程

银河麒麟系统开启SSH服务与远程连接配置教程

许多用户在银河麒麟V10桌面操作系统上完成环境部署后,常会遇到一个典型问题:如何从其他计算机远程连接至该系统?尽管系统运行正常,但使用SSH客户端连接时却频繁出现超时或拒绝访问的错误。这通常是由于几个关键配置环节未就绪所致——可能是SSH服务未安装、防火墙规则限制,或是身份验证设置未正确开启。 无需

时间:2026-05-17 14:04
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程