Перейти к содержанию

Мониторинг

Для просмотра используемых ресурсов сервера необходимо в разделе Серверы основного меню выбрать целевой сервер, после чего в открывшемся окне во вкладке Мониторинг отобразится следующая информация:

  • Графики загрузки CPU и RAM сервера.

    Пример графиков использования CPU и RAM

    "image

    Для анализа использования аппаратных мощностей кластера можно настроить отображение графиков, нажав на кнопку слева от графиков Задать интервал и в открывшемся окне настроить интервал.

    Для увеличения определенного интервала можно нажать на кнопку Масштабировать и в миниатюрном изображении графиков под основными графиками выделить область для просмотра.

    Остановить или восстановить процесс мониторинга можно с помощью кнопок Остановить и Восстановить.

  • Суммарная текущая частота.

    Рабочая частота CPU сервера.

  • Текущая нагрузка CPU.

    Как считается потребление CPU сервером:

    scalar(100 - (avg by (job) (irate(node_cpu_seconds_total{mode="idle"}[3m])) * 100))
    

  • Оперативная память.

  • Объем занятой памяти под кэш.

  • Текущая нагрузка оперативной памяти.

    Как считается потребление RAM сервером:

    filters = 'job="{id}"[{interval}s]'.format(id=node.uuid, interval=interval)
    memory_rate = prometheus.query(
       metric=f"scalar(100 * (avg_over_time(node_memory_MemTotal_bytes{filters}) "
              f"- avg_over_time(node_memory_MemFree_bytes{filters}) - "
              f"avg_over_time(node_memory_Buffers_bytes{filters}) - "
              f"avg_over_time(node_memory_Cached_bytes{filters})) / "
              f"avg_over_time(node_memory_MemTotal_bytes{filters}))")
    

  • Среднее значение загрузки системы за ⅕/15 минут.

    Показывает среднее отношение имеющихся запросов на вычислительные ресурсы к количеству этих самых ресурсов за заданный промежуток времени (1 минута, 5 минут и 15 минут).

    Если среднее значение загрузки:

    • Меньше числа ядер (потоков) CPU, то это означает, что на выполнение всех текущих запросов тратится такое количество тиков, которое меньше доступного количества тиков CPU.

    • Равно числу ядер (потоков) CPU, то это означает, что на выполнение всех текущих запросов тратится такое количество тиков, которое равно доступному количеству тиков CPU.

    • Больше числа ядер (потоков) CPU, то это означает, что на выполнение всех текущих запросов тратится такое количество тиков, которое больше доступного количества тиков CPU (часть запросов ожидают выполнение и не могут быть выполнены своевременно).

    Ожидание выполнения запросов может происходить не только по причине загрузки CPU, но и из-за дисковой нагрузки ввода/вывода (запрос не может быть выполнен, пока не будут получены данные с диска и т.д.).

  • Нагрузка процессора ВМ.

    Нагрузка на CPU, которую создают ВМ.

  • Нагрузка памяти ВМ.

    Используемый ВМ объем RAM.

  • Количество памяти ВМ.

    Объем RAM, выданный ВМ.