Перейти к содержанию

Стек статистики

Сбор статистики осуществляется с помощью ПО prometheus. На контроллере находится центральный сервис prometheus, который собирает метрики с сервисов node_exporter и domain_exporter с каждого узла.

Примечание

На основе сбора статистики работают сервисы распределения ВМ по узлам, то есть выбор узлов для создания, переноса, восстановления ВМ. Поэтому при отказе сервисов данные операции, возможно, будут недоступны.


Команды CLI для работы с сервисами

Для проверки статуса сервисов:

  • Проверка статуса prometheus на контроллере выполняется командой CLI services list.

  • Проверка статуса prometheus на узле (сервис node-statistics) выполняется командой CLI services list.

  • Проверка базы prometheus на контроллере выполняется командой CLI system statistics.


Порты сервисов

  • Центральный prometheus на контроллере: порт 9090.

  • prometheus статистики узла: порт 9100.

  • prometheus статистики ВМ: порт 9177.

  • Grafana: порт 3000.


Каталог хранения статистики на контроллере

/var/log/prometheus/metrics2


Просмотр и работа с графиками (Grafana)

Grafana — это платформа для визуализации, мониторинга и анализа данных. В рамках SpaceVM она является дополнительным обособленным инструментом, используемым при необходимости расширенного мониторинга элементов платформы виртуализации.

Преднастроенными являются приборные панели: SpaceVM Node Dashboard для мониторинга данных узла и SpaceVM Domains Dashboard для мониторинга данных виртуальных машин и SpaceVM PostgreSQL Dashboard.

Пользователь может добавлять свои панели и источники данных.

  • Запуск/остановка Web-интерфейса grafana на контроллере выполняется командами CLI grafana [start|stop]. Для просмотра преднастроенных Dashboards необходимо выполнить команды:
    grafana stop
    grafana start
    
  • Базовые логин/пароль:

    • Для SpaceVM версии 6.5.6 и ниже: admin/admin.

    • Для SpaceVM версии 6.5.7 и выше: SpaceVM/bazalt.

  • Порт 3000 (пример http://192.168.20.120:3000, где 192.168.20.120 адрес контроллера)


Управление временем хранения статистики узлов на контроллере

Выполняется на контроллере командой CLI:

system statistics set_storage_retention -h
system statistics set_storage_retention -t 240 -s 1

Аргументы:

-h, --help

Вызов справки и выход.

-t

Время хранения статистики в часах.

-s , --size

Размер хранимой статистики в Гбайтах.

Базовое значение - 240 часов (10 дней).


Расчет размера каталога статистики на контроллере

1 вычислительный узел (ВУ) за 1 день при штатной работе условно займет 150 Мб.

Пример расчета для 20 ВУ с временем хранения 7 дней

Для 20 ВУ с временем хранения 168 часов (7 дней) каталог будет занимать примерно 21 Гбайт.

Пример расчета для 5 ВУ с временем хранения 15 дней

Для 5 ВУ с временем хранения 360 часов (15 дней) каталог будет занимать примерно 11.2 Гбайт.

Пример расчета для 30 ВУ с временем хранения 30 дней

Для 30 ВУ с временем хранения 30 дней каталог будет занимать примерно 135 Гбайт.

Итого примерный размер каталога равен

150 Мбайт * количество ВУ * количество дней.