Метрики TCF¶
Метрики TCF-worker¶
Метрики позволяют отслеживать статус кластера, количество переданных и прочитанных данных, а также диагностировать ошибки при обмене данными между кластерами:
Метрики для TCF-worker можно получить по данному адресу обработчика запроса:
http://<instance_host>:<http_port>/metrics
Пример запроса:
curl -X GET --location "http://192.168.64.9:8080/metrics" | grep tcf_is_active
Состояние кластера¶
tcf_is_active
– активность текущего кластера. Тип: gauge. Возможные значения:
1: активный кластер;
0: пассивный кластер.
Пример:
# HELP tcf_is_active Is active cluster
# TYPE tcf_is_active gauge
tcf_is_active 1
Отставание репликации¶
tcf_source_vclock_signature
– последний записанный vclock на исходном кластере. Тип: gauge. Разница между значениями vclock на кластерах может сигнализировать о задержках в репликации
Пример:
# HELP tcf_source_vclock_signature VClock signature (vclock sum)
# TYPE tcf_source_vclock_signature gauge
tcf_source_vclock_signature{replicaSetUUID="35b25911-7d4c-4323-9c84-f8401dd024fb"} 61520
Метрики Gateway¶
Этот раздел содержит информацию об использовании метрик для мониторинга работы Gateway:
Чтобы включить метрики компонента Gateway, задайте в файле конфигурации межкластерных репликаторов опцию gateway.metrics_enabled:
gateway:
# ...
metrics_enabled: true
Далее необходимо настроить HTTP API. Для этого задайте опцию gateway.http_server.
После запуска Gateway метрики можно получить по данному адресу обработчика запроса:
http://<gateway_host>:<metrics_port>/metrics
Отправка данных¶
tcf_gateway_send_total
– суммарное количество записей, отправленных на компонент Destination. Тип: counter. Пример:# HELP tcf_gateway_send_total Total send rows to destination # TYPE tcf_gateway_send_total counter tcf_gateway_send_total{spaceName="example_space", replicaSetUUID="1234-5678-abc"} 1000
tcf_gateway_send_errors_total
– суммарное количество ошибок, возникших при отправке данных на компонент Destination. Тип: counter. Пример:# HELP tcf_gateway_send_errors_total Total destination errors # TYPE tcf_gateway_send_errors_total counter tcf_gateway_send_errors_total{spaceName="example_space", replicaSetUUID="1234-5678-abc"} 5
Чтение данных¶
tcf_gateway_read_total
– суммарное количество записей, прочитанных с исходного кластера. Тип: counter.Пример:
# HELP tcf_gateway_read_total Total rows read from source # TYPE tcf_gateway_read_total counter tcf_gateway_read_total{spaceName="example_space", replicaSetUUID="1234-5678-abc"} 1500
tcf_gateway_read_errors_total
– суммарное количество ошибок, возникших при чтении данных с исходного кластера. Тип: counter.Пример:
# HELP tcf_gateway_read_errors_total Total reading errors # TYPE tcf_gateway_read_errors_total counter tcf_gateway_read_errors_total{spaceName="example_space", replicaSetUUID="1234-5678-abc"} 2
Метрики Destination¶
Этот раздел содержит информацию об использовании метрик для мониторинга работы Destination:
Чтобы включить метрики компонента Destination, задайте в файле конфигурации межкластерных репликаторов опцию destination.metrics_enabled:
destination:
# ...
metrics_enabled: true
Далее необходимо настроить HTTP API. Для этого задайте опцию destination.http_server.
После запуска компонента Destination метрики можно получить по данному адресу обработчика запроса:
http://<destination_host>:<metrics_port>/metrics
Пример запроса метрик:
curl -X GET --location "http://192.168.64.12:10082/metrics" | grep tcf_destination
Производительность¶
Эти метрики помогают оценить объем данных, которые обрабатывает и передает система, а также ее общую активность.
tcf_destination_push_total
– cуммарное количество событий, отправленных в Destination. Тип: counter.Пример:
# HELP tcf_destination_push_total Total events pushed to destination # TYPE tcf_destination_push_total counter tcf_destination_push_total{spaceName="example-space",replicaSetUUID="example-replica"} 67890
ttpusher_pusher_writes_total
– cуммарное количество записанных сообщений для выбранного Destination. Тип: counter.Пример:
# HELP ttpusher_pusher_writes_total Total writes of the pusher instance # TYPE ttpusher_pusher_writes_total counter ttpusher_pusher_writes_total{space_name="dd6ce3ac-4a75-4aa0-9cec-21391184d75d"} 7
tcf_destination_recv_total
– общее количество событий, полученных от компонента Gateway. Тип: counter.Разница между значениями метрик
tcf_destination_recv_total
иtcf_destination_push_total
может указывать на проблемы с обработкой данных или их потерю.Пример:
# HELP tcf_destination_recv_total Total events received from gateway # TYPE tcf_destination_recv_total counter tcf_destination_recv_total{spaceName="example-space",replicaSetUUID="example-replica"} 12345
Контроль состояния системы¶
Эти метрики необходимы для отслеживания проблем в процессе получения или отправки данных.
tcf_destination_recv_errors_total
– общее количество ошибок при получении данных. Тип: counter.Пример:
# HELP tcf_destination_recv_errors_total Total receiving errors # TYPE tcf_destination_recv_errors_total counter tcf_destination_recv_errors_total{reason="timeout"} 3
tcf_destination_push_errors_total
– количество ошибок, возникших в Destination при попытке отправить данные на целевой кластер. Тип: counter.Пример:
# HELP tcf_destination_push_errors_total Total pushing errors # TYPE tcf_destination_push_errors_total counter tcf_destination_push_errors_total{spaceName="example-space",replicaSetUUID="example-replica"} 2
ttpusher_writer_status
– текущее состояние компонента Destination. Тип: gauge. Возможные значения:1: Destination работает в штатном режиме;
0: Destination работает с ошибками.
Пример:
# HELP ttpusher_writer_status Writer status # TYPE ttpusher_writer_status gauge ttpusher_writer_status{source_replicaset_uuid="35b25911-7d4c-4323-9c84-f8401dd024fb"} 1
Синхронизация и нагрузка¶
Эта метрика полезна для отслеживания состояния синхронизации и выполнения репликации данных в системе.
ttpusher_vclock
– последний записанный vclock signature для компонента Destination. Тип: gauge.
Пример:
# HELP ttpusher_vclock Current Source Replicaset VClock
# TYPE ttpusher_vclock gauge
ttpusher_vclock{replica="1",source_replicaset_uuid="35b25911-7d4c-4323-9c84-f8401dd024fb"} 0
ttpusher_vclock{replica="2",source_replicaset_uuid="35b25911-7d4c-4323-9c84-f8401dd024fb"} 61834