Новое решение для мониторинга системы DirectumRX

20 0

Администратор СЭД поддерживает стабильную и производительную работы системы. Для этого он контролирует состояние сервисов, объем хранящихся данных и скорость выполняемых операций. Теперь все эти действия можно выполнять «в одном окне» с помощью нового решения «Мониторинг системы DirectumRX».

Решение собирает данные из лог-файлов системы DirectumRX и значения счетчиков производительности операционной системы. Полученные результаты помогают наглядно оценить стабильность развернутых сервисов, загрузку процессора, состояние оперативной памяти и т.д. А если в организации уже используется система мониторинга Zabbix, ее можно подключить к решению с помощью готового плагина.

Для оперативного контроля можно настроить автоматическую рассылку уведомлений, которая запускается, если отслеживаемый параметр превышает пороговое значение. Решение поддерживает отправку по почте или через дополнительные каналы связи, например, Slack.

Преимущества

Простая установка. Чтобы начать использовать решение, достаточно развернуть виртуальную машину с уже установленным ПО и заданными основными настройками.

Гибкость настройки. Дашборды, панели и конфигурационные файлы предоставляются в открытом виде. Это помогает адаптировать решение под потребности организации на уровне настройки, не прибегая к разработке.

Расширяемость. Архитектура решения позволяет подключить к системе мониторинга несколько систем DirectumRX, а также другие продукты компании.

Использование ПО с открытым исходным кодом в составе решения существенно снижает стоимость владения ИТ-инфраструктурой предприятия.

Доступность. Решение предоставляется бесплатно по запросу в службу поддержки DIRECTUM.

Архитектура

Решение поставляется в виде виртуальной машины с развернутой инфраструктурой для мониторинга. Основу архитектуры составляют популярные и быстро развивающиеся программные продукты.

  • Telegraf/Zabbix снимает значения счетчиков производительности с ОС на серверах, на которых установлена СУБД и сервисы DirectumRX.
  • Filebeat передает лог-файлы сервисов DirectumRX в Logstash для обработки.
  • Logstash с помощью правил преобразует данные, полученные от Filebeat, из текстового вида в структурированный для дальнейшего анализа и индексирования.
  • Elasticsearch отвечает за хранение, индексирование и поиск данных.
  • Grafana визуализирует данные и отправляет уведомления. На странице решения выводит информацию о состоянии системы в разрезе сервисов и решаемых задач.

Использование

На сайте решения администратор может быстро найти связанную с ошибками информацию: пользователей, типы объектов, временной интервал, состояние серверов и т.д. Благодаря этому можно решить проблему самостоятельно или подготовить максимально полное обращение в службу поддержки DirectumRX.


Панели на странице окрашены в цвета в зависимости от типа и количества ошибок. На панели отображаются ссылки с информацией об ошибках. При нажатии на ссылку открывается детальная информация с соответствующим фильтром.

Далее рассмотрим два примера использования решения.

Недоступность сервера

Представим, что администратор получил почтовую рассылку об ошибках «Истекло время ожидания ответа сервера». Некоторые пользователи сообщили, что не могут войти в систему.

Чтобы решить вопрос, администратор открывает дашборд «Сводные данные по ошибкам сервиса» с фильтром по критичным ошибкам. С помощью панели можно оценить, насколько часто возникает ошибка, нет ли других массовых ошибок.

Далее администратор отфильтровывает список, оставляя только нужную ошибку. С помощью панели «Пользователи» определяет, у каких пользователей она возникает, и проверяет сетевое подключение. В нашем случае ошибка возникает на конкретных рабочих местах, поэтому одна из возможных причин – нестабильное сетевое подключение между компьютерами пользователей и сервером приложений.

Если анализ сети показывает, что подключение стабильно, администратор собирает дополнительную информацию об ошибке. Для этого сужает интервал времени, в котором возникла ошибка, и открывает детальную информацию об ошибке.


На открывшемся дашборде «Детальный анализ» отображаются все зафиксированные события за выбранный интервал. Администратор анализирует события и устраняет причину. При необходимости оформляет обращение в службу поддержки, приложив полученную информацию.

Когда ошибка устранена, администратор убеждается, что она больше не возникает.

Медленная работа системы

Представим другую ситуацию: пользователи сообщили, что веб-клиент DirectumRX работает медленно.

Администратор проверяет значение метрик серверов, на которых развернуты сервисы DirectumRX и СУБД, с помощью дашборда «Состояние сервера. Windows». В нашем случае видны пики по средней очереди и числу обращений к диску.

Причиной может быть, например, резервное копирование во время работы пользователей, ресурсоемкая операция в фоновом процессе или неоптимальная прикладная разработка, замедляющая работу системы при большом количестве пользователей.

Кроме того, на производительность системы оказывают влияние долго выполняющиеся запросы. Чтобы найти их, администратор использует дашборд «WebClient. Долгие запросы». Администратор сортирует данные по длительности и определяет запросы с наибольшей длительностью.

Администратор устраняет причину: изменяет расписание резервного копирования, устанавливает более быстрый диск и т.д. Если самостоятельно устранить не удается, обращается в службу поддержки. В этом случае данные, полученные администратором, помогают ускорить решение вопроса.

После изменения расписания резервного копирования и замены диска на более быстрый на панели видно, что средняя очередь и число обращений к диску уменьшились.

* * *

Подробную информацию о получении технического решения можно узнать в службе поддержки DIRECTUM по телефону 8-800-234-72-11 или e-mail: support@directum.ru.

Ждем ваши вопросы и комментарии!

20
Авторизуйтесь, чтобы оценить материал.
6
Пока комментариев нет.

Авторизуйтесь, чтобы написать комментарий