Метрики Tarantool CDC | Cdc

Version:

latest

Метрики Tarantool CDC

Метки Универсального Обработчика

cdc_connector_hold_time

  • Тип метрики: summary

  • Описание: Время, проведенное событием во внутренней очереди коннектора.

  • Метки:

    • quantile:

      • 50;

      • 95;

      • 99.

  • Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.

  • Аномальное поведение метрики: Значение индикатора возрастает.

  • Дата последнего обновления: 2026-03-31

cdc_connector_trip_time

  • Тип метрики: summary

  • Описание: Время, потраченное коннектором к Источнику на получение событий из Источника данных %.

  • Метки:

    • quantile:

      • 50;

      • 95;

      • 99.

  • Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.

  • Аномальное поведение метрики: Значение индикатора возрастает.

  • Дата последнего обновления: 2026-03-31

cdc_errors

  • Тип метрики: counter

  • Описание: Количество ошибок, возникающих при работе Универсального Обработчика.

  • Ожидаемое поведение метрики: Счетчик не увеличивается.

  • Аномальное поведение метрики: Скорость возрастания счетчика ненулевая.

  • Дата последнего обновления: 2026-03-31

cdc_offsets_commitable

  • Тип метрики: gauge

  • Описание: Текущее количество подтвержденных контрольных точек.

  • Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.

  • Аномальное поведение метрики: Значение индикатора возрастает или постоянно равно 0.

  • Дата последнего обновления: 2026-03-31

cdc_offsets_commited_total

  • Тип метрики: counter

  • Описание: Количество успешно записанных контрольных точек. Счетчик увеличивается на количество успешно подтвержденных сообщений каждый раз при успешной записи контрольных точек.

  • Ожидаемое поведение метрики: Монотонно возрастает. Если брать скорость возрастания метрики на интервале бОльшем или равном периоду записи контрольных точек и сравнить со скоростью возрастания количества записанных событий в очередь на том же интервале, то эти метрики должны совпадать.

  • Аномальное поведение метрики: Счетчик не возрастает.

  • Дата последнего обновления: 2026-03-31

cdc_offsets_errors_total

  • Тип метрики: counter

  • Описание: Количество ошибок записи контрольных точек. При возникновенни ошибки при записи пакета контрольных точек, счетчик ошибок увеличивается на количество точек, которые не были записаны из за ошибки.

  • Ожидаемое поведение метрики: Равен 0 или не возрастает.

  • Аномальное поведение метрики: Счетчик возрастает.

  • Дата последнего обновления: 2026-03-31

cdc_offsets_uncommitable

  • Тип метрики: gauge

  • Описание: Текущее количество неподтвержденных контрольных точек.

  • Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.

  • Аномальное поведение метрики: Значение индикатора возрастает.

  • Дата последнего обновления: 2026-03-31

cdc_poll_time

  • Тип метрики: histogram

  • Описание: Время, затраченное на выполнение операций чтения данных из коннектора к Источнику данных. Метрика замеряется на уровне приложения.

  • Метки:

    • quantile:

      • 0.5;

      • 0.95;

      • 0.99.

  • Ожидаемое поведение метрики: Время чтения колеблется вокруг некоторого значения, в небольших пределах. Время чтения не должно превышать расчетных показателей больше, чем на некоторый процент. При увеличении размера сообщений время чтения также может увеличиваться.

  • Аномальное поведение метрики: Возрастание без существенного изменения размера сообщений может указывать на следующие причины:

    • Деградация работы Источника.

    • Деградация сети на участке между Источником данных и коннектором к Источнику.

    • Проблемы коннектора к Источнику данных.

    • Перегрузка процессора.

    • Утечка, переполнение памяти.

  • Дата последнего обновления: 2026-03-31

cdc_records

  • Тип метрики: counter

  • Описание: Количество событий, прошедших через Универсальный Обработчик, с детализацией по статусу.

  • Метки:

    • status:

      • received – Количество событий, полученных из Источника данных.

      • retried – Количество событий, которые потребовали повторной попытки отправки.

      • sent – Количество событий, успешно записанных в Приемник данных.

  • Ожидаемое поведение метрики: Скорость возрастания счетчика стабильна или увеличивается. При небольшом или отсутствующем потоке репликации, снижении потока сообщений в Приемник данных скорость возрастания счетчика близка к или равна 0 на некоторых отрезках времени.

  • Аномальное поведение метрики: Скорость возрастания счетчика уменьшается или счетчик не увеличивается, причины:

    • Ошибки получения данных.

    • Увеличение времени чтения или записи данных.

    • Деградация сети на участке между коннектором к Приемнику и Приемникмом данных.

    • Перегрузка процессора.

    • Утечка, переполнение памяти.

  • Дата последнего обновления: 2026-03-31

cdc_task

  • Тип метрики: gauge

  • Описание: Индикатор активности процесса с соответствующими значениями тегов source и sink. Когда процесс запушен, значение этой метрики всегда равно 1. Суммированием этой метрики можно посчитать количество работающих экземпляров.

  • Метки:

    • connector:

      • source – Информация о запущенном коннекторе к Источнику данных.

      • sink – Информация о запущенном коннекторе к Приемнику данных.

  • Ожидаемое поведение метрики: Для отдельного экземпляра - значение равно 1.

  • Аномальное поведение метрики: Значение, равное 0 или отсутствие этой метрики в выборке при запросе к системе мониторинга означает, что ни один из экземпляров системы не работает.

  • Дата последнего обновления: 2026-03-31

cdc_trip_time

  • Тип метрики: summary

  • Описание: Общее время, затраченное на перенос события от Источника до Приемника данных.

  • Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.

  • Аномальное поведение метрики: Значение индикатора возрастает.

  • Дата последнего обновления: 2026-03-31

cdc_write_time

  • Тип метрики: summary

  • Описание: Время, затраченное на выполнение операции записи данных в Приемник данных.

  • Метки:

    • quantile:

      • 0.5;

      • 0.95;

      • 0.99.

  • Ожидаемое поведение метрики: Время записи колеблется вокруг некоторого значения, в небольших пределах. Время записи не должно превышать расчетных показателей больше, чем на некоторый процент. При увеличении размера сообщений время записи также может увеличиваться.

  • Аномальное поведение метрики: Возрастание времени записи сообщений в Приемник может указывать на следующие причины:

    • Деградация сети на участке между коннектором к Приемнику и Приемникмом данных.

    • Деградация работы Приемника.

    • Проблемы коннектора к Приемнику.

    • Перегрузка процессора.

    • Утечка, переполнение памяти.

  • Дата последнего обновления: 2026-03-31

Метрики Java

application_ready_time_seconds

  • Тип метрики: gauge

  • Описание: Время запуска приложения.

  • Метки:

    • main_application_class:

      • io.tarantool.worker.* – Java класс.

  • Ожидаемое поведение метрики: Время запуска колеблется в небольших пределах вокруг некоторого значения, не занимает существенный процент от общей работы Tarantool CDC.

  • Аномальное поведение метрики: При стабильном возрастании времени запуска приложения, если процессы уходят на перезапуск, это является негативной динамикой. Означает перегруз системы.

  • Дата последнего обновления: 2026-03-31

jvm_gc_overhead_percent

  • Тип метрики: gauge

  • Описание: Приблизительный процент использования процессора сборщиком мусора относительно использования процессора за предыдущий период или с начала запуска процесса.

  • Ожидаемое поведение метрики: Показатель стабилен, его значение колеблется с небольшой амплитудой вокруг некоторого значения.

  • Аномальное поведение метрики: Возрастание данного показателя является признаком проблем с использованием памяти и сборкой мусора.

  • Дата последнего обновления: 2026-03-31

jvm_gc_pause_seconds

  • Тип метрики: summary

  • Описание: Время, затраченное на паузы для сборщика мусора.

  • Ожидаемое поведение метрики: Значение показателя стабильно, уменьшается или колеблется с небольшой амплитудой вокруг некоторого значения.

  • Аномальное поведение метрики: Возрастание затрачиваемого времени на сборку мусора указывает на проблемы с использованием памяти и сборкой мусора. Большие и частые паузы могут влиять на общую пропускную способность системы.

  • Дата последнего обновления: 2026-03-31

jvm_gc_pause_seconds_max

  • Тип метрики: gauge

  • Описание: Максимальная пауза в работе сборщика мусора.

  • Ожидаемое поведение метрики: Значение показателя стабильно, уменьшается или колеблется с небольшой амплитудой вокруг некоторого значения.

  • Аномальное поведение метрики: Возрастание затрачиваемого времени на сборку мусора указывает на проблемы с использованием памяти и сборкой мусора. Большие и частые паузы могут влиять на общую пропускную способность системы.

  • Дата последнего обновления: 2026-03-31

jvm_memory_used_bytes

  • Тип метрики: gauge

  • Описание: Количество использованной памяти.

  • Метки:

    • area:

      • nonheap;

      • heap.

    • id:

      • CodeHeap;

      • G1 Survivor Space;

      • G1 Old Gen;

      • G1 Eden Space;

      • Metaspace;

      • Compressed Class Space.

  • Ожидаемое поведение метрики: При возрастании потока сообщений и их размера, может наблюдаться пропорциональное увеличение использования памяти. Использование памяти при стабильном потоке сообщений должно быть также стабильно.

  • Аномальное поведение метрики: Увеличение использования памяти при отсутствии соответствующих изменений в потоке данных может указывать на утечку памяти.

  • Дата последнего обновления: 2026-03-31

jvm_threads_daemon_threads

  • Тип метрики: gauge

  • Описание: Текущее количество потоков, запущенных в режиме daemon.

  • Ожидаемое поведение метрики: Количество запущенных потоков в режиме daemon стабильно или колеблется в небольших пределах вокруг некоторого значения.

  • Аномальное поведение метрики: Возрастание количества работающих потоков в режиме daemon может указывать на утечку ресурсов, перегрузку системы.

  • Дата последнего обновления: 2026-03-31

jvm_threads_live_threads

  • Тип метрики: gauge

  • Описание: Текущее количество запущенных потоков в системе.

  • Ожидаемое поведение метрики: Количество запущенных потоков стабильно или колеблется в небольших пределах вокруг некоторого значения.

  • Аномальное поведение метрики: Возрастание количества работающих потоков может указывать на утечку ресурсов, перегрузку системы.

  • Дата последнего обновления: 2026-03-31

jvm_threads_peak_threads

  • Тип метрики: gauge

  • Описание: Максимальное количество потоков, когда либо работавших в системе одновременно с момента запуска или с сброса индикатора.

  • Ожидаемое поведение метрики: Показатель может возрастать в начале работы Tarantool CDC, но в остальное время должен оставаться без изменений.

  • Аномальное поведение метрики: Возрастание максимального количества работающих потоков может указывать на утечку ресурсов, перегрузку системы.

  • Дата последнего обновления: 2026-03-31

jvm_threads_started_threads_total

  • Тип метрики: counter

  • Описание: Общее количество потоков в системе, запущенных и отработанных.

  • Ожидаемое поведение метрики: Скорость возрастания метрики нулевая или близка к нулю.

  • Аномальное поведение метрики: Возрастание общего количества потоков может указывать на утечку ресурсов, перегрузку системы.

  • Дата последнего обновления: 2026-03-31

jvm_threads_states_threads

  • Тип метрики: gauge

  • Описание: Текущее количество потоков, запущенных Java-машиной.

  • Метки:

    • state:

      • blocked;

      • runnable;

      • waiting;

      • terminated;

      • timed-waiting;

      • new.

  • Ожидаемое поведение метрики: Количество потоков стабильно в течении длительного периода работы Tarantool CDC, или колеблется с небольшой амплитудой вокруг некоторого значения. Количество потоков является примерной суммой следующих показателей:

    • Общие потоки Java Runtime.

    • Потоки, запущенные коннекторами для обработки данных.

    • Потоки сборщика мусора.

  • Аномальное поведение метрики: Возрастание количества потоков может указывать на утечку ресурсов, перегрузку системы с последующим возрастанием нагрузки на сборщик мусора.

  • Дата последнего обновления: 2026-03-31

process_cpu_usage

  • Тип метрики: gauge

  • Описание: Текущее использование процессора Java-машиной.

  • Ожидаемое поведение метрики: Низкий показатель использования процессора указывает на стабильную работу системы. Также снижение использования процессора может быть связано со снижением потока данных.

  • Аномальное поведение метрики: Возрастание использования процессора может указывать на перегрузку системы.

  • Дата последнего обновления: 2026-03-31

process_files_open_files

  • Тип метрики: gauge

  • Описание: Количество открытых файловых дескрипторов. Носит информационный характер. Может понадобиться при расследовании причин падений и ошибок, случающихся в компонентах.

  • Ожидаемое поведение метрики: Количество открытых файловых дескрипторов (сетевых сокетов) стабильно в течение продолжительного времени работы Tarantool CDC или колеблется с незначительной амплитудой вокруг некоторого значения.

  • Аномальное поведение метрики: Стабильное увеличение данной метрики является аномальным, указывает на утечку ресурсов, перегрузку системы.

  • Дата последнего обновления: 2026-03-31

system_load_average_1m

  • Тип метрики: gauge

  • Описание: Средняя загрузка системы в течение одной минуты. С точки зрения JVM это интерпретируется как количество готовых к исполнению объектов, запланированных к выполнению плюс количество таких объектов, выполняющихся на процессоре в данный момент. Временное окно - 1 минута.

  • Ожидаемое поведение метрики: Показатель средней загрузки стабилен или колеблется в небольших пределах вокруг некоторого значения, или пропорционально соответствует потоку сообщений.

  • Аномальное поведение метрики: Стабильное возрастание средней загрузки может указывать на утечку ресурсов, перегрузку системы.

  • Дата последнего обновления: 2026-03-31

Found what you were looking for?
Feedback