Описание Сервиса
Сервис мониторинга платформы «ГосТех» соответствует следующим основным требованиям:
- обеспечение ролевого доступа к Сервису и данным мониторинга;
- обеспечение автоматического сбора и долговременного хранения метрик состояния ресурсов в платформе «ГосТех»;
- отображение метрики на Сервисных панелях (dashboards);
- поддержка загрузки собственных метрик с использованием API;
- поддержка выгрузки метрик ресурсов и пользовательских метрик с помощью API;
- обеспечение создания собственных панелей и графиков;
- поддержка меток для идентификации и описания характеристик временных рядов;
- поддержка настроек уведомлений («тревожных сигналов», alerts) об изменении состояния ресурса платформы «ГосТех»;
- поддержка каналов уведомлений: электронной почты, SMS;
- поддержка агрегации значений всех метрик в соответствии с политикой прореживания;
- автоматическое удаление устаревших метрик (TTL) в соответствии с заданными правилами;
- для интеграции с Сервисами расширения поддержка двух режимов загрузки метрик: режимы pull и push;
- в режиме pull Сервис мониторинга осуществляет сбор метрик с объекта контроля в формате Prometheus с заданной периодичностью;
- в режиме push Сервис мониторинга предоставляет REST и gRPC API и принимает через него информацию по метрикам объектов со следующими полями в теле запроса:
| Название заголовка/переменной | Тип | Обязательно | Описание |
|---|---|---|---|
Заголовок | |||
serviceName | string | Да | Имя Сервиса |
serviceVersion | string | Да | Версия Сервиса |
instanceID | string | Да | Уникальный идентификатор экземпляра Сервиса |
Тело | |||
metrics | Array (MetricData[]) | Да | Метрики |
Элементы массива metrics | |||
name | string | Да | Имя метрики |
value | string | Да | Значение метрики в указанной точке |
timestamp | string | Да | Временная метка |
labels.xxx | string | Нет | Любые пользовательские метки |
Ответ | |||
string |
Обязательным (но не ограниченным) набором метрик является:
- метрики использования системных ресурсов (CPU, RAM, Memory);
- время исполнения входящих запросов;
- количество успешных/неуспешных выполнений входящих запросов;
- время исполнения исходящих запросов или обращений к СПО;
- количество успешных/неуспешных выполнений исходящих запросов или обращений к СПО.
В случае необходимости Исполнитель должен обеспечить корректировку метрик в зависимости от потребности Потребителя услуг в рамках реализации запроса на изменение в соответствии с регламентом эксплуатации.