Мониторинг

Для просмотра используемых ресурсов сервера необходимо в разделе Серверы основного меню выбрать целевой сервер, после чего в открывшемся окне во вкладке Мониторинг отобразится следующая информация:

Графики загрузки CPU и RAM сервера.

Для анализа использования аппаратных мощностей кластера можно настроить отображение графиков, нажав на кнопку слева от графиков и в открывшемся окне настроить интервал.

Для увеличения определенного интервала можно нажать на кнопку и в миниатюрном изображении графиков под основными графиками выделить область для просмотра.

Остановить или восстановить процесс мониторинга можно с помощью кнопок и .

Пример графиков использования CPU и RAM
Суммарная текущая частота.

Рабочая частота CPU сервера.
Текущая нагрузка CPU.
Как считается потребление CPU сервером:
```
scalar(100 - (avg by (job) (irate(node_cpu_seconds_total{mode="idle"}[3m])) * 100))
```
Оперативная память.
Объем занятой памяти под кэш.

Текущая нагрузка оперативной памяти.

Как считается потребление RAM сервером:

filters = 'job="{id}"[{interval}s]'.format(id=node.uuid, interval=interval)
memory_rate = prometheus.query(
   metric=f"scalar(100 * (avg_over_time(node_memory_MemTotal_bytes{filters}) "
          f"- avg_over_time(node_memory_MemFree_bytes{filters}) - "
          f"avg_over_time(node_memory_Buffers_bytes{filters}) - "
          f"avg_over_time(node_memory_Cached_bytes{filters})) / "
          f"avg_over_time(node_memory_MemTotal_bytes{filters}))")

Среднее значение загрузки системы за ⅕/15 минут.
Показывает среднее отношение имеющихся запросов на вычислительные ресурсы к количеству этих самых ресурсов за заданный промежуток времени (1 минута, 5 минут и 15 минут).

Если среднее значение загрузки:
- Меньше числа ядер (потоков) CPU, то это означает, что на выполнение всех текущих запросов тратится такое количество тиков, которое меньше доступного количества тиков CPU.
- Равно числу ядер (потоков) CPU, то это означает, что на выполнение всех текущих запросов тратится такое количество тиков, которое равно доступному количеству тиков CPU.
- Больше числа ядер (потоков) CPU, то это означает, что на выполнение всех текущих запросов тратится такое количество тиков, которое больше доступного количества тиков CPU (часть запросов ожидают выполнение и не могут быть выполнены своевременно).
Ожидание выполнения запросов может происходить не только по причине загрузки CPU, но и из-за дисковой нагрузки ввода/вывода (запрос не может быть выполнен, пока не будут получены данные с диска и т.д.).
Нагрузка процессора ВМ.

Нагрузка на CPU, которую создают ВМ.
Нагрузка памяти ВМ.

Используемый ВМ объем RAM.
Количество памяти ВМ.

Объем RAM, выданный ВМ.