2. Руководство по эксплуатации / 2.7. Ремонтная очередь
2. Руководство по эксплуатации / 2.7. Ремонтная очередь

2.7. Ремонтная очередь

2.7. Ремонтная очередь

Когда объект поступает в систему на обработку, он сразу помещается в ремонтную очередь. Если объект удалось обработать и сохранить, он удаляется из ремонтной очереди. В случае ошибки объекты остаются в ремонтной очереди, и администратор имеет возможность просматривать их и после устранения источника проблемы отправлять на повторную обработку.

Можно выделить следующие основные причины возникновения ошибок, когда объекты остаются в ремонтной очереди:

  • Ошибка при обработке объекта в каком-либо из пайплайнов.

  • Система TDG ожидает объект в определенном формате, но объект пришел из внешней системы в другом формате.

  • Внутренняя ошибка системы.

  • Сбой оборудования (hardware).

Работать с объектами в ремонтной очереди можно через web-интерфейс на вкладке Repair.

../_images/repair01.png

В таблице отображается текущий список объектов в ремонтной очереди. Двойной клик на объект в таблице открывает отдельное окно Object info со следующей информацией об объекте:

  • Id — UUID объекта;

  • Time — дата и время, когда объект был помещен в ремонтную очередь;

  • Status — статус объекта в ремонтной очереди (возможные значения: «New», «In Progress», «Reworked»);

  • Reason — описание причины ошибки и полный stack trace;

  • Object — текущая структура объекта в формате JSON.

../_images/repair02.png

Для поиска нужного объекта есть возможность фильтрации по любому сочетанию символов в любой колонке таблицы — поле Filter; по дате и времени — поле Start Time ~ End Time.

Доступные действия над объектами в ремонтной очереди:

  • Try again — повторная обработка объекта той же функцией пайплайна, при выполнении которой возникла ошибка;

  • Delete — удаление объекта из ремонтной очереди.

Когда объект попадает в ремонтную очередь, он имеет статус «New». При повторной обработке статус объекта меняется на «In Progress». Если обработка прошла успешна, объект удаляется из ремонтной очереди. Если при повторной обработке опять возникла ошибка, система выдаст сообщение об ошибке, и объект останется в ремонтной очереди со статусом «Reworked».

Аналогично действиям над отдельными объектами, можно выполнить действия над всеми объектами в ремонтной очереди:

  • Try again all — повторная обработка всех объектов;

  • Clear queue — удаление всех объектов из ремонтной очереди.

2.7.1. Нотификации

В системе есть возможность информировать пользователей о попадании объекта в ремонтную очередь. Для этого должна быть определена роль notifier, а также заданы настройки почтового сервера и подписчиков, которым будут отправляться нотификации.

Роль notifier задается на одном из инстансов при настройке ролей в кластере. Настройки почтового сервера и подписчиков задаются через web-интерфейс на вкладках Settings > Mail server и Settings > Subscribers соответственно.

2.7.1.1. Settings > Mail server

Настройки:

  • Url — сервер SMTP, используемый для отправки нотификаций;

  • From — отправитель, который будет показан в почтовом клиенте;

  • User name — имя пользователя сервера SMTP;

  • Password — пароль пользователя сервера SMTP;

  • Timeout (sec) — тайм-аут запроса к серверу SMTP, в секундах.

2.7.1.2. Settings > Subscribers

Необходимо создать подписчиков (кнопка Create subscriber), которые будут получать нотификации, указав их имя и Email. Возможные действия с подписчиками аналогичны действиям с пользователями. Можно

  • создать новых подписчиков;

  • редактировать данные текущих подписчиков: изменить имя и Email;

  • удалить подписчиков.