Метрики Tarantool CDC¶
Метки Универсального Обработчика¶
cdc_connector_hold_time¶
Тип метрики: summary
Описание: Время, проведенное событием во внутренней очереди коннектора.
Метки:
quantile:
50;95;99.
Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.
Аномальное поведение метрики: Значение индикатора возрастает.
Дата последнего обновления: 2026-03-31
cdc_connector_trip_time¶
Тип метрики: summary
Описание: Время, потраченное коннектором к Источнику на получение событий из Источника данных %.
Метки:
quantile:
50;95;99.
Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.
Аномальное поведение метрики: Значение индикатора возрастает.
Дата последнего обновления: 2026-03-31
cdc_errors¶
Тип метрики: counter
Описание: Количество ошибок, возникающих при работе Универсального Обработчика.
Ожидаемое поведение метрики: Счетчик не увеличивается.
Аномальное поведение метрики: Скорость возрастания счетчика ненулевая.
Дата последнего обновления: 2026-03-31
cdc_offsets_commitable¶
Тип метрики: gauge
Описание: Текущее количество подтвержденных контрольных точек.
Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.
Аномальное поведение метрики: Значение индикатора возрастает или постоянно равно
0.Дата последнего обновления: 2026-03-31
cdc_offsets_commited_total¶
Тип метрики: counter
Описание: Количество успешно записанных контрольных точек. Счетчик увеличивается на количество успешно подтвержденных сообщений каждый раз при успешной записи контрольных точек.
Ожидаемое поведение метрики: Монотонно возрастает. Если брать скорость возрастания метрики на интервале бОльшем или равном периоду записи контрольных точек и сравнить со скоростью возрастания количества записанных событий в очередь на том же интервале, то эти метрики должны совпадать.
Аномальное поведение метрики: Счетчик не возрастает.
Дата последнего обновления: 2026-03-31
cdc_offsets_errors_total¶
Тип метрики: counter
Описание: Количество ошибок записи контрольных точек. При возникновенни ошибки при записи пакета контрольных точек, счетчик ошибок увеличивается на количество точек, которые не были записаны из за ошибки.
Ожидаемое поведение метрики: Равен
0или не возрастает.Аномальное поведение метрики: Счетчик возрастает.
Дата последнего обновления: 2026-03-31
cdc_offsets_uncommitable¶
Тип метрики: gauge
Описание: Текущее количество неподтвержденных контрольных точек.
Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.
Аномальное поведение метрики: Значение индикатора возрастает.
Дата последнего обновления: 2026-03-31
cdc_poll_time¶
Тип метрики: histogram
Описание: Время, затраченное на выполнение операций чтения данных из коннектора к Источнику данных. Метрика замеряется на уровне приложения.
Метки:
quantile:
0.5;0.95;0.99.
Ожидаемое поведение метрики: Время чтения колеблется вокруг некоторого значения, в небольших пределах. Время чтения не должно превышать расчетных показателей больше, чем на некоторый процент. При увеличении размера сообщений время чтения также может увеличиваться.
Аномальное поведение метрики: Возрастание без существенного изменения размера сообщений может указывать на следующие причины:
Деградация работы Источника.
Деградация сети на участке между Источником данных и коннектором к Источнику.
Проблемы коннектора к Источнику данных.
Перегрузка процессора.
Утечка, переполнение памяти.
Дата последнего обновления: 2026-03-31
cdc_records¶
Тип метрики: counter
Описание: Количество событий, прошедших через Универсальный Обработчик, с детализацией по статусу.
Метки:
status:
received– Количество событий, полученных из Источника данных.retried– Количество событий, которые потребовали повторной попытки отправки.sent– Количество событий, успешно записанных в Приемник данных.
Ожидаемое поведение метрики: Скорость возрастания счетчика стабильна или увеличивается. При небольшом или отсутствующем потоке репликации, снижении потока сообщений в Приемник данных скорость возрастания счетчика близка к или равна
0на некоторых отрезках времени.Аномальное поведение метрики: Скорость возрастания счетчика уменьшается или счетчик не увеличивается, причины:
Ошибки получения данных.
Увеличение времени чтения или записи данных.
Деградация сети на участке между коннектором к Приемнику и Приемникмом данных.
Перегрузка процессора.
Утечка, переполнение памяти.
Дата последнего обновления: 2026-03-31
cdc_task¶
Тип метрики: gauge
Описание: Индикатор активности процесса с соответствующими значениями тегов
sourceиsink. Когда процесс запушен, значение этой метрики всегда равно1. Суммированием этой метрики можно посчитать количество работающих экземпляров.Метки:
connector:
source– Информация о запущенном коннекторе к Источнику данных.sink– Информация о запущенном коннекторе к Приемнику данных.
Ожидаемое поведение метрики: Для отдельного экземпляра - значение равно
1.Аномальное поведение метрики: Значение, равное
0или отсутствие этой метрики в выборке при запросе к системе мониторинга означает, что ни один из экземпляров системы не работает.Дата последнего обновления: 2026-03-31
cdc_trip_time¶
Тип метрики: summary
Описание: Общее время, затраченное на перенос события от Источника до Приемника данных.
Ожидаемое поведение метрики: Колеблется вокруг некоторого значения.
Аномальное поведение метрики: Значение индикатора возрастает.
Дата последнего обновления: 2026-03-31
cdc_write_time¶
Тип метрики: summary
Описание: Время, затраченное на выполнение операции записи данных в Приемник данных.
Метки:
quantile:
0.5;0.95;0.99.
Ожидаемое поведение метрики: Время записи колеблется вокруг некоторого значения, в небольших пределах. Время записи не должно превышать расчетных показателей больше, чем на некоторый процент. При увеличении размера сообщений время записи также может увеличиваться.
Аномальное поведение метрики: Возрастание времени записи сообщений в Приемник может указывать на следующие причины:
Деградация сети на участке между коннектором к Приемнику и Приемникмом данных.
Деградация работы Приемника.
Проблемы коннектора к Приемнику.
Перегрузка процессора.
Утечка, переполнение памяти.
Дата последнего обновления: 2026-03-31
Метрики Java¶
application_ready_time_seconds¶
Тип метрики: gauge
Описание: Время запуска приложения.
Метки:
main_application_class:
io.tarantool.worker.*– Java класс.
Ожидаемое поведение метрики: Время запуска колеблется в небольших пределах вокруг некоторого значения, не занимает существенный процент от общей работы Tarantool CDC.
Аномальное поведение метрики: При стабильном возрастании времени запуска приложения, если процессы уходят на перезапуск, это является негативной динамикой. Означает перегруз системы.
Дата последнего обновления: 2026-03-31
jvm_gc_overhead_percent¶
Тип метрики: gauge
Описание: Приблизительный процент использования процессора сборщиком мусора относительно использования процессора за предыдущий период или с начала запуска процесса.
Ожидаемое поведение метрики: Показатель стабилен, его значение колеблется с небольшой амплитудой вокруг некоторого значения.
Аномальное поведение метрики: Возрастание данного показателя является признаком проблем с использованием памяти и сборкой мусора.
Дата последнего обновления: 2026-03-31
jvm_gc_pause_seconds¶
Тип метрики: summary
Описание: Время, затраченное на паузы для сборщика мусора.
Ожидаемое поведение метрики: Значение показателя стабильно, уменьшается или колеблется с небольшой амплитудой вокруг некоторого значения.
Аномальное поведение метрики: Возрастание затрачиваемого времени на сборку мусора указывает на проблемы с использованием памяти и сборкой мусора. Большие и частые паузы могут влиять на общую пропускную способность системы.
Дата последнего обновления: 2026-03-31
jvm_gc_pause_seconds_max¶
Тип метрики: gauge
Описание: Максимальная пауза в работе сборщика мусора.
Ожидаемое поведение метрики: Значение показателя стабильно, уменьшается или колеблется с небольшой амплитудой вокруг некоторого значения.
Аномальное поведение метрики: Возрастание затрачиваемого времени на сборку мусора указывает на проблемы с использованием памяти и сборкой мусора. Большие и частые паузы могут влиять на общую пропускную способность системы.
Дата последнего обновления: 2026-03-31
jvm_memory_used_bytes¶
Тип метрики: gauge
Описание: Количество использованной памяти.
Метки:
area:
nonheap;heap.
id:
CodeHeap;G1 Survivor Space;G1 Old Gen;G1 Eden Space;Metaspace;Compressed Class Space.
Ожидаемое поведение метрики: При возрастании потока сообщений и их размера, может наблюдаться пропорциональное увеличение использования памяти. Использование памяти при стабильном потоке сообщений должно быть также стабильно.
Аномальное поведение метрики: Увеличение использования памяти при отсутствии соответствующих изменений в потоке данных может указывать на утечку памяти.
Дата последнего обновления: 2026-03-31
jvm_threads_daemon_threads¶
Тип метрики: gauge
Описание: Текущее количество потоков, запущенных в режиме daemon.
Ожидаемое поведение метрики: Количество запущенных потоков в режиме daemon стабильно или колеблется в небольших пределах вокруг некоторого значения.
Аномальное поведение метрики: Возрастание количества работающих потоков в режиме daemon может указывать на утечку ресурсов, перегрузку системы.
Дата последнего обновления: 2026-03-31
jvm_threads_live_threads¶
Тип метрики: gauge
Описание: Текущее количество запущенных потоков в системе.
Ожидаемое поведение метрики: Количество запущенных потоков стабильно или колеблется в небольших пределах вокруг некоторого значения.
Аномальное поведение метрики: Возрастание количества работающих потоков может указывать на утечку ресурсов, перегрузку системы.
Дата последнего обновления: 2026-03-31
jvm_threads_peak_threads¶
Тип метрики: gauge
Описание: Максимальное количество потоков, когда либо работавших в системе одновременно с момента запуска или с сброса индикатора.
Ожидаемое поведение метрики: Показатель может возрастать в начале работы Tarantool CDC, но в остальное время должен оставаться без изменений.
Аномальное поведение метрики: Возрастание максимального количества работающих потоков может указывать на утечку ресурсов, перегрузку системы.
Дата последнего обновления: 2026-03-31
jvm_threads_started_threads_total¶
Тип метрики: counter
Описание: Общее количество потоков в системе, запущенных и отработанных.
Ожидаемое поведение метрики: Скорость возрастания метрики нулевая или близка к нулю.
Аномальное поведение метрики: Возрастание общего количества потоков может указывать на утечку ресурсов, перегрузку системы.
Дата последнего обновления: 2026-03-31
jvm_threads_states_threads¶
Тип метрики: gauge
Описание: Текущее количество потоков, запущенных Java-машиной.
Метки:
state:
blocked;runnable;waiting;terminated;timed-waiting;new.
Ожидаемое поведение метрики: Количество потоков стабильно в течении длительного периода работы Tarantool CDC, или колеблется с небольшой амплитудой вокруг некоторого значения. Количество потоков является примерной суммой следующих показателей:
Общие потоки Java Runtime.
Потоки, запущенные коннекторами для обработки данных.
Потоки сборщика мусора.
Аномальное поведение метрики: Возрастание количества потоков может указывать на утечку ресурсов, перегрузку системы с последующим возрастанием нагрузки на сборщик мусора.
Дата последнего обновления: 2026-03-31
process_cpu_usage¶
Тип метрики: gauge
Описание: Текущее использование процессора Java-машиной.
Ожидаемое поведение метрики: Низкий показатель использования процессора указывает на стабильную работу системы. Также снижение использования процессора может быть связано со снижением потока данных.
Аномальное поведение метрики: Возрастание использования процессора может указывать на перегрузку системы.
Дата последнего обновления: 2026-03-31
process_files_open_files¶
Тип метрики: gauge
Описание: Количество открытых файловых дескрипторов. Носит информационный характер. Может понадобиться при расследовании причин падений и ошибок, случающихся в компонентах.
Ожидаемое поведение метрики: Количество открытых файловых дескрипторов (сетевых сокетов) стабильно в течение продолжительного времени работы Tarantool CDC или колеблется с незначительной амплитудой вокруг некоторого значения.
Аномальное поведение метрики: Стабильное увеличение данной метрики является аномальным, указывает на утечку ресурсов, перегрузку системы.
Дата последнего обновления: 2026-03-31
system_load_average_1m¶
Тип метрики: gauge
Описание: Средняя загрузка системы в течение одной минуты. С точки зрения JVM это интерпретируется как количество готовых к исполнению объектов, запланированных к выполнению плюс количество таких объектов, выполняющихся на процессоре в данный момент. Временное окно - 1 минута.
Ожидаемое поведение метрики: Показатель средней загрузки стабилен или колеблется в небольших пределах вокруг некоторого значения, или пропорционально соответствует потоку сообщений.
Аномальное поведение метрики: Стабильное возрастание средней загрузки может указывать на утечку ресурсов, перегрузку системы.
Дата последнего обновления: 2026-03-31