Prometheus与Grafana监控Spring Boot应用

Prometheus介绍

Prometheus是一套开源的监控&报警&时间序列数据库的组合

它可以监控主机、服务、容器,支持多种exporter采集数据,还支持pushgateway进行数据上报

Prometheus性能足以支撑上万台规模的集群

主要特征

  • 多维度数据模型,可以通过多个维度对数据建模,也可以通过多个维度对数据进行查询
  • 灵活的查询语言,提供灵活的PromQL查询,还提供了HTTP查询接口,可以方便地结合Grafana等组件展示数据
  • 不依赖分布式存储,支持单节点的本地存储。通过Prometheus自带的时序数据库,可以完成每秒百万级的数据存储,如果需要存储大量历史数据,还可以对接第三方的时序数据库
  • 以HTTP方式,通过pull模型拉取时间序列数据,并提供了开放的指标数据标准
  • 可以通过中间网关支持push模型
  • 通过服务发现或者静态配置来发现目标服务对象
  • 支持多种多样的图表和界面展示,可以使用第三方的工具来展示内容,如Grafana

监控原理

  • Prometheus Server负责定时在目标上抓取metrics(指标)数据
  • 每个抓取目标[主机、服务]都需要暴露一个HTTP服务接口用于Prometheus定时抓取

Pull方式的优势是能够自动进行上游监控和水平监控,配置更少,更容易扩展,更灵活,更容易实现高可用

配置文件六个大配置段的含义

image-20250402101537720.png

  • prometheus配置文件各个大配置段

    • scrape\_configs 采集配置段 做采集器
    • rule\_files 告警、预聚合配置文件段
    • remote\_read 远程查询段
    • remote\_write 远程写入段
    • alerting: Alertmanager信息段
对应的配置段用途
采集配置段做采集器,数据保存在本地
采集配置段 + 远程写入段做采集器+传输器,数据保存在本地+远端存储
远程查询段做查询器,查询远端存储数据
采集配置段 + 远程查询段做采集器+查询器,查询本地数据+远端存储数据
采集配置段 + Alertmanager信息段 + 告警配置文件段做采集器+告警触发器,查询本地数据生成报警发往Alertmanager
远程查询段 + Alertmanager信息段 + 告警配置文件段做远程告警触发器,查询远端数据生成报警发往Alertmanager
远程查询段+远程写入段 + 预聚合配置文件段做预聚合指标,生成的结果集指标写入远端存储
  • yaml具体配置格式
# 全局配置段
global:
  # 采集间隔 
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  # 计算报警和预聚合间隔
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # 采集超时时间
  scrape_timeout: 10s 
  # 查询日志,包含各阶段耗时统计
  query_log_file: /opt/logs/prometheus_query_log
  # 全局标签组
  # 通过本实例采集的数据都会叠加下面的标签
  external_labels:
    account: 'huawei-main'
    region: 'node1'
​
# Alertmanager信息段
alerting:
  alertmanagers:
  - scheme: http
    static_configs:
    - targets:
      - "localhost:9090"
​
# 告警、预聚合配置文件段
rule_files:
    - /etc/prometheus/rules/record.yml
    - /etc/prometheus/rules/alert.yml
​
# 采集配置段
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'
​
    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.
​
    static_configs:
    - targets: ['localhost:9090']
​
# 远程查询段
remote_read:
  # prometheus 
  - url: http://prometheus/v1/read
    read_recent: true
​
  # m3db 
  - url: "http://m3coordinator-read:7201/api/v1/prom/remote/read"
    read_recent: true
​
# 远程写入段
remote_write:
  - url: "http://m3coordinator-write:7201/api/v1/prom/remote/write"
    queue_config:
      capacity: 10000
      max_samples_per_send: 60000
    write_relabel_configs:
      - source_labels: [__name__]
        separator: ;
        # 标签key前缀匹配到的drop
        regex: '(kubelet_|apiserver_|container_fs_).*'
        replacement: $1
        action: drop

部署prometheus

编写Spring Boot代码

  • 创建一个Spring Boot项目
    image-20250402103919530.png
  • 添加依赖
<dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-actuator</artifactId>
        </dependency>
        
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>
​
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
            <scope>test</scope>
        </dependency>
​
        <dependency>
            <groupId>io.micrometer</groupId>
            <artifactId>micrometer-registry-prometheus</artifactId>
            <scope>runtime</scope>
        </dependency>
  • 添加配置
spring:
  application:
    name: springboot-prometheus-demo
management:
  endpoints:
    web:
      exposure:
        include: "*"
  endpoint:
    prometheus:
      enabled: true
    health:
      show-details: always
  metrics:
    export:
      prometheus:
        descriptions: true
​
server:
  port: 3000
  • 配置启动类
@SpringBootApplication
public class DemoApplication {
​
    public static void main(String[] args) {
        SpringApplication.run(DemoApplication.class, args);
    }
​
    @Bean
    MeterRegistryCustomizer<MeterRegistry> configurer(
            @Value("${spring.application.name}") String applicationName) {
        return (registry) -> registry.config().commonTags("application", applicationName);
    }
​
}

安装部署Prometheus服务监控

  • 拉取镜像
docker pull prom/prometheus
  • 准备prometheus.yml配置文件
global:
  scrape_interval: 15s
​
rule_files:
  - /etc/prometheus/alert.rules.yml
​
scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['localhost:9090']
      
    # 配置要监控的服务
  - job_name: 'springboot_prometheus_demo'
    scrape_interval: 5s
    metrics_path: '/actuator/prometheus'
    static_configs:
      - targets: ['xxx.xxx.xxx.xxx:xxx']
​
alerting:
  alertmanagers:
  - static_configs:
    - targets: ['alertmanager:9093']

将该文件保存到 /opt/prometheus/config/prometheus.yml

  • 启动Prometheus容器
docker run -d \
  --name prometheus \
  -p 9090:9090 \
  -v /opt/prometheus/config/prometheus.yml:/etc/prometheus/prometheus.yml \
  -v /opt/prometheus/data:/prometheus \
  prom/prometheus

安装部署Grafana

  • 拉取镜像
docker pull grafana/grafana
  • 启动容器
docker run -d -p 3000:3000 --name=grafana \
  --volume grafana-storage:/var/lib/grafana \
  grafana/grafana
  • 配置Grafana

启动容器后,您可以通过浏览器访问 http://localhost:3000 来访问 Grafana 的 Web 界面。默认的管理员用户名和密码都是 admin
image-20250402103239697.png
image-20250402103312080.png

image-20250402103327476.png

填写Prometheus地址保存

添加dashboard

image-20250402103636406.png
image-20250402103628843.png

填写4701,表示提供的一个JVM监控模板

即可监控Spring Boot应用
image-20250402103749536.png

最后修改:2025 年 04 月 02 日
如果觉得我的文章对你有用,请随意赞赏