Панель мониторинга¶

В TCF с версии 0.8.0 реализована панель мониторинга, которая предоставляет информацию о ключевых метриках, таких как состояние Gateway, Destination и экземпляров Tarantool внутри дата-центра.

Панели мониторинга упрощают контроль за состоянием системы: вместо ручного анализа записей в журнале и метрик они сразу показывают отклонения – скачки задержек, ошибки, падение трафика и другие потенциальные проблемы.

Grafana и Prometheus поддерживают настройку предупреждений, которые автоматически уведомляют о критических событиях – например, при недоступности узла или превышении порога задержки. Это снижает время реакции на инциденты и помогает поддерживать стабильную работу системы.

Этот раздел содержит информацию о том, как настроить панель мониторинга. Также представлен пример конфигурации для развертывания кластеров с настроенной панелью мониторинга.

Настройка панели мониторинга¶

Предварительные требования¶

Чтобы настроить панель мониторинга в Grafana, необходимо:

Установить и добавить в переменную окружения PATH следующие инструменты:

jsonnet – язык конфигурации;
jb – менеджер пакетов для jsonnet;
jsonnetfmt – инструмент для форматирования файлов .jsonnet и .libsonnet, если необходимо отформатировать эти файлы;
mage – инструмент для сборки (build system) на языке Go (альтернатива Make), предназначенный для написания скриптов сборки в виде Go-кода.

Использовать Prometheus версии v3 или выше. Это связано с несовместимостью формата значения квантилей. Дополнительную информацию можно найти в документации Prometheus.
Подготовить архив с дистрибутивом продукта, на котором будут развернуты кластеры и хранилище конфигурации, и архив с дистрибутивом TCF нужной версии для установки. Подробнее об этом читайте в разделе Подготовка архивов для установки.

Сборка панели мониторинга¶

Чтобы собрать панель мониторинга в Grafana и получить результат в формате JSON, выполните команду в корневой директории распакованного архива TCF:

mage buildmonitoring

Форматирование файлов jsonnet¶

Чтобы отформатировать все файлы в папке мониторинга с расширениями .jsonnet и .libsonnet, выполните команду:

mage formatjsonnet

Запуск панели мониторинга¶

Запустите стенд TCF. Стенд состоит из двух кластеров Tarantool DB с TCF и общего хранилища конфигурации на основе Tarantool. Для запуска стенда последовательно пройдите инструкции по настройке хранилища конфигурации, кластеров и межкластерных репликаторов данных.
Запустите Docker-контейнеры с конфигурацией Grafana и Prometheus. Для этого перейдите в директорию распакованного архива с TCF ./monitoring и запустите контейнеры с помощью команды:
```
cd monitoring
docker compose up
```
Для просмотра графиков в Grafana перейдите по адресу localhost:3000 в вашем браузере.

Пример конфигурации панели мониторинга для Prometheus¶

global:
  scrape_interval: 5s
  evaluation_interval: 5s
 
scrape_configs:
  - job_name: "cluster_a"
    static_configs:
      - targets:
          - localhost:8081
          - localhost:8082
          - localhost:8083
          - localhost:8084
          - localhost:8085
  - job_name: "cluster_b"
    static_configs:
      - targets:
          - localhost:18081
          - localhost:18082
          - localhost:18083
          - localhost:18084
          - localhost:18085
  - job_name: "replicators"
    static_configs:
      - targets:
          - localhost:10081
          - localhost:10082
          - localhost:10181
          - localhost:10182

Здесь:

global:
- scrape_interval – интервал, с которым Prometheus будет собирать метрики (каждые 5 секунд);
- evaluation_interval – интервал, с которым будет оцениваться состояние правил в Prometheus (5 секунд);
scrape_configs – список задач (jobs) для сбора метрик с различных сервисов или кластеров;
- targets – список целей, каждая цель указывает на определённый сервис или экземпляр, с которого Prometheus должен запросить метрики;
- cluster_a – список адресов сервисов из исходного кластера;
- cluster_b – список адресов сервисов из целевого кластера;
- replicators – список адресов репликаторов Gateway и Destination.

Примечание

В конфигурации Prometheus важно, чтобы были настроены три задачи (jobs):

cluster_a — экземпляры кластера A;
cluster_b — экземпляры кластера B;
replicators — экземпляры Gateway и Destination.

Конфигурация псевдонима (alias) экземпляра репликатора¶

Чтобы правильно отображать метрики репликаторов в Grafana, нужно задать псевдоним (alias) Gateway и Destination в конфигурации репликаторов данных, в секциях gateway.alias и destination.alias соответственно:

gateway:
  alias: 'my_gateway_1_2'
destination:
  alias: 'my_destination_1_2'