Метрики TCF | Clusters_Federation

Метрики TCF

Метрики TCF-worker

Метрики позволяют отслеживать статус кластера, количество переданных и прочитанных данных, а также диагностировать ошибки при обмене данными между кластерами:

Метрики для TCF-worker можно получить по данному адресу обработчика запроса:

http://<instance_host>:<http_port>/metrics

Пример запроса:

curl -X GET --location "http://192.168.64.9:8080/metrics" | grep tcf_is_active

Состояние кластера

tcf_is_active – активность текущего кластера. Тип: gauge. Возможные значения:

  • 1: активный кластер;

  • 0: пассивный кластер.

Пример:

# HELP tcf_is_active Is active cluster
# TYPE tcf_is_active gauge
tcf_is_active 1

Отставание репликации

tcf_source_vclock_signature – последний записанный vclock на исходном кластере. Тип: gauge. Разница между значениями vclock на кластерах может сигнализировать о задержках в репликации

Пример:

# HELP tcf_source_vclock_signature VClock signature (vclock sum)
# TYPE tcf_source_vclock_signature gauge
tcf_source_vclock_signature{replicaSetUUID="35b25911-7d4c-4323-9c84-f8401dd024fb"} 61520

Метрики Gateway

Этот раздел содержит информацию об использовании метрик для мониторинга работы Gateway:

Чтобы включить метрики компонента Gateway, задайте в файле конфигурации межкластерных репликаторов опцию gateway.metrics_enabled:

gateway:
   # ...
   metrics_enabled: true

Далее необходимо настроить HTTP API. Для этого задайте опцию gateway.http_server.

После запуска Gateway метрики можно получить по данному адресу обработчика запроса:

http://<gateway_host>:<metrics_port>/metrics

Отправка данных

  • tcf_gateway_send_total – суммарное количество записей, отправленных на компонент Destination. Тип: counter. Пример:

    # HELP tcf_gateway_send_total Total send rows to destination
    # TYPE tcf_gateway_send_total counter
    tcf_gateway_send_total{spaceName="example_space", replicaSetUUID="1234-5678-abc"} 1000
    
  • tcf_gateway_send_errors_total – суммарное количество ошибок, возникших при отправке данных на компонент Destination. Тип: counter. Пример:

    # HELP tcf_gateway_send_errors_total Total destination errors
    # TYPE tcf_gateway_send_errors_total counter
    tcf_gateway_send_errors_total{spaceName="example_space", replicaSetUUID="1234-5678-abc"} 5
    

Чтение данных

  • tcf_gateway_read_total – суммарное количество записей, прочитанных с исходного кластера. Тип: counter.

    Пример:

    # HELP tcf_gateway_read_total Total rows read from source
    # TYPE tcf_gateway_read_total counter
    tcf_gateway_read_total{spaceName="example_space", replicaSetUUID="1234-5678-abc"} 1500
    
  • tcf_gateway_read_errors_total – суммарное количество ошибок, возникших при чтении данных с исходного кластера. Тип: counter.

    Пример:

    # HELP tcf_gateway_read_errors_total Total reading errors
    # TYPE tcf_gateway_read_errors_total counter
    tcf_gateway_read_errors_total{spaceName="example_space", replicaSetUUID="1234-5678-abc"} 2
    

Метрики Destination

Этот раздел содержит информацию об использовании метрик для мониторинга работы Destination:

Чтобы включить метрики компонента Destination, задайте в файле конфигурации межкластерных репликаторов опцию destination.metrics_enabled:

destination:
   # ...
   metrics_enabled: true

Далее необходимо настроить HTTP API. Для этого задайте опцию destination.http_server.

После запуска компонента Destination метрики можно получить по данному адресу обработчика запроса:

http://<destination_host>:<metrics_port>/metrics

Пример запроса метрик:

curl -X GET --location "http://192.168.64.12:10082/metrics" | grep tcf_destination

Производительность

Эти метрики помогают оценить объем данных, которые обрабатывает и передает система, а также ее общую активность.

  • tcf_destination_push_total – cуммарное количество событий, отправленных в Destination. Тип: counter.

    Пример:

    # HELP tcf_destination_push_total Total events pushed to destination
    # TYPE tcf_destination_push_total counter
    tcf_destination_push_total{spaceName="example-space",replicaSetUUID="example-replica"} 67890
    
  • ttpusher_pusher_writes_total – cуммарное количество записанных сообщений для выбранного Destination. Тип: counter.

    Пример:

    # HELP ttpusher_pusher_writes_total Total writes of the pusher instance
    # TYPE ttpusher_pusher_writes_total counter
    ttpusher_pusher_writes_total{space_name="dd6ce3ac-4a75-4aa0-9cec-21391184d75d"} 7
    
  • tcf_destination_recv_total – общее количество событий, полученных от компонента Gateway. Тип: counter.

    Разница между значениями метрик tcf_destination_recv_total и tcf_destination_push_total может указывать на проблемы с обработкой данных или их потерю.

    Пример:

    # HELP tcf_destination_recv_total Total events received from gateway
    # TYPE tcf_destination_recv_total counter
    tcf_destination_recv_total{spaceName="example-space",replicaSetUUID="example-replica"} 12345
    

Контроль состояния системы

Эти метрики необходимы для отслеживания проблем в процессе получения или отправки данных.

  • tcf_destination_recv_errors_total – общее количество ошибок при получении данных. Тип: counter.

    Пример:

    # HELP tcf_destination_recv_errors_total Total receiving errors
    # TYPE tcf_destination_recv_errors_total counter
    tcf_destination_recv_errors_total{reason="timeout"} 3
    
  • tcf_destination_push_errors_total – количество ошибок, возникших в Destination при попытке отправить данные на целевой кластер. Тип: counter.

    Пример:

    # HELP tcf_destination_push_errors_total Total pushing errors
    # TYPE tcf_destination_push_errors_total counter
    tcf_destination_push_errors_total{spaceName="example-space",replicaSetUUID="example-replica"} 2
    
  • ttpusher_writer_status – текущее состояние компонента Destination. Тип: gauge. Возможные значения:

    • 1: Destination работает в штатном режиме;

    • 0: Destination работает с ошибками.

    Пример:

    # HELP ttpusher_writer_status Writer status
    # TYPE ttpusher_writer_status gauge
    ttpusher_writer_status{source_replicaset_uuid="35b25911-7d4c-4323-9c84-f8401dd024fb"} 1
    

Синхронизация и нагрузка

Эта метрика полезна для отслеживания состояния синхронизации и выполнения репликации данных в системе.

ttpusher_vclock – последний записанный vclock signature для компонента Destination. Тип: gauge.

Пример:

# HELP ttpusher_vclock Current Source Replicaset VClock
# TYPE ttpusher_vclock gauge
ttpusher_vclock{replica="1",source_replicaset_uuid="35b25911-7d4c-4323-9c84-f8401dd024fb"} 0
ttpusher_vclock{replica="2",source_replicaset_uuid="35b25911-7d4c-4323-9c84-f8401dd024fb"} 61834
Нашли ответ на свой вопрос?
Обратная связь