Prometheus与Grafana监控Spring Boot应用
Prometheus介绍
Prometheus是一套开源的监控&报警&时间序列数据库的组合
它可以监控主机、服务、容器,支持多种exporter采集数据,还支持pushgateway进行数据上报
Prometheus性能足以支撑上万台规模的集群
主要特征
- 多维度数据模型,可以通过多个维度对数据建模,也可以通过多个维度对数据进行查询
- 灵活的查询语言,提供灵活的PromQL查询,还提供了HTTP查询接口,可以方便地结合Grafana等组件展示数据
- 不依赖分布式存储,支持单节点的本地存储。通过Prometheus自带的时序数据库,可以完成每秒百万级的数据存储,如果需要存储大量历史数据,还可以对接第三方的时序数据库
- 以HTTP方式,通过pull模型拉取时间序列数据,并提供了开放的指标数据标准
- 可以通过中间网关支持push模型
- 通过服务发现或者静态配置来发现目标服务对象
- 支持多种多样的图表和界面展示,可以使用第三方的工具来展示内容,如Grafana
监控原理
- Prometheus Server负责定时在目标上抓取metrics(指标)数据
- 每个抓取目标[主机、服务]都需要暴露一个HTTP服务接口用于Prometheus定时抓取
Pull方式的优势是能够自动进行上游监控和水平监控,配置更少,更容易扩展,更灵活,更容易实现高可用
配置文件六个大配置段的含义
prometheus配置文件各个大配置段
- scrape\_configs 采集配置段 做采集器
- rule\_files 告警、预聚合配置文件段
- remote\_read 远程查询段
- remote\_write 远程写入段
- alerting: Alertmanager信息段
对应的配置段 | 用途 |
---|---|
采集配置段 | 做采集器,数据保存在本地 |
采集配置段 + 远程写入段 | 做采集器+传输器,数据保存在本地+远端存储 |
远程查询段 | 做查询器,查询远端存储数据 |
采集配置段 + 远程查询段 | 做采集器+查询器,查询本地数据+远端存储数据 |
采集配置段 + Alertmanager信息段 + 告警配置文件段 | 做采集器+告警触发器,查询本地数据生成报警发往Alertmanager |
远程查询段 + Alertmanager信息段 + 告警配置文件段 | 做远程告警触发器,查询远端数据生成报警发往Alertmanager |
远程查询段+远程写入段 + 预聚合配置文件段 | 做预聚合指标,生成的结果集指标写入远端存储 |
- yaml具体配置格式
# 全局配置段
global:
# 采集间隔
scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
# 计算报警和预聚合间隔
evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
# 采集超时时间
scrape_timeout: 10s
# 查询日志,包含各阶段耗时统计
query_log_file: /opt/logs/prometheus_query_log
# 全局标签组
# 通过本实例采集的数据都会叠加下面的标签
external_labels:
account: 'huawei-main'
region: 'node1'
# Alertmanager信息段
alerting:
alertmanagers:
- scheme: http
static_configs:
- targets:
- "localhost:9090"
# 告警、预聚合配置文件段
rule_files:
- /etc/prometheus/rules/record.yml
- /etc/prometheus/rules/alert.yml
# 采集配置段
scrape_configs:
# The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
- job_name: 'prometheus'
# metrics_path defaults to '/metrics'
# scheme defaults to 'http'.
static_configs:
- targets: ['localhost:9090']
# 远程查询段
remote_read:
# prometheus
- url: http://prometheus/v1/read
read_recent: true
# m3db
- url: "http://m3coordinator-read:7201/api/v1/prom/remote/read"
read_recent: true
# 远程写入段
remote_write:
- url: "http://m3coordinator-write:7201/api/v1/prom/remote/write"
queue_config:
capacity: 10000
max_samples_per_send: 60000
write_relabel_configs:
- source_labels: [__name__]
separator: ;
# 标签key前缀匹配到的drop
regex: '(kubelet_|apiserver_|container_fs_).*'
replacement: $1
action: drop
部署prometheus
编写Spring Boot代码
- 创建一个Spring Boot项目
- 添加依赖
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
<scope>test</scope>
</dependency>
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-registry-prometheus</artifactId>
<scope>runtime</scope>
</dependency>
- 添加配置
spring:
application:
name: springboot-prometheus-demo
management:
endpoints:
web:
exposure:
include: "*"
endpoint:
prometheus:
enabled: true
health:
show-details: always
metrics:
export:
prometheus:
descriptions: true
server:
port: 3000
- 配置启动类
@SpringBootApplication
public class DemoApplication {
public static void main(String[] args) {
SpringApplication.run(DemoApplication.class, args);
}
@Bean
MeterRegistryCustomizer<MeterRegistry> configurer(
@Value("${spring.application.name}") String applicationName) {
return (registry) -> registry.config().commonTags("application", applicationName);
}
}
安装部署Prometheus服务监控
- 拉取镜像
docker pull prom/prometheus
- 准备prometheus.yml配置文件
global:
scrape_interval: 15s
rule_files:
- /etc/prometheus/alert.rules.yml
scrape_configs:
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']
# 配置要监控的服务
- job_name: 'springboot_prometheus_demo'
scrape_interval: 5s
metrics_path: '/actuator/prometheus'
static_configs:
- targets: ['xxx.xxx.xxx.xxx:xxx']
alerting:
alertmanagers:
- static_configs:
- targets: ['alertmanager:9093']
将该文件保存到 /opt/prometheus/config/prometheus.yml
- 启动Prometheus容器
docker run -d \
--name prometheus \
-p 9090:9090 \
-v /opt/prometheus/config/prometheus.yml:/etc/prometheus/prometheus.yml \
-v /opt/prometheus/data:/prometheus \
prom/prometheus
安装部署Grafana
- 拉取镜像
docker pull grafana/grafana
- 启动容器
docker run -d -p 3000:3000 --name=grafana \
--volume grafana-storage:/var/lib/grafana \
grafana/grafana
- 配置Grafana
启动容器后,您可以通过浏览器访问 http://localhost:3000
来访问 Grafana 的 Web 界面。默认的管理员用户名和密码都是 admin
填写Prometheus地址保存
添加dashboard
填写4701,表示提供的一个JVM监控模板
即可监控Spring Boot应用