Мониторинг системы Directum 5x при помощи системы Zabbix 3.2

Опубликовано:
22 июня 2018 в 13:32
  • 3

В ИТ-инфраструктуре своей организации я использую множество различных хостов на Windows/Linux/Unix OS. Все многообразие сервисов мониторится через систему Zabbix. Встала необходимость реализации мониторинга корпоративной системы Directum. Стандартные шаблоны Zabbix "Template OS Windows " хорош, но в нем слишком много всего подгружается из системы. Настроен автодисковер служб, нет элементов данных по считыванию логов с сервера.

Описания по установке самого Zabbix здесь не будет, их много в сети.

Итак сделал свой шаблон мониторинга на основе доработанного дефолтного "Template OS Windows ".

Включил мониторинг служб:

  • SBSessionServer
  • SBWorkflowProcessingServer
  • SBFileStorageService
  • DirectumInterchangeSystemsIntegration
  • DicsAgentService
  • DCTSCaptureService
  • DCTSTransformationService
  • DTSTransformationService_2
  • DTSTransformationService_3
  • SBEventProcessingService
  • WebAccessAgentSvc
  • Ario Classifier Service
  • Ario Fact Extractor Service
  • SQLBrowser
  • SQLWriter
  • MSSQLSERVER
  • IISADMIN

Добавил логирование Windows Журналов

  • eventlog[DAC Event Log,,"Error|Information"]
  • eventlog[DICS EventLog,,"Error|Information"]
  • eventlog[System,,"Error|Information"]
  • eventlog[Dcts EventLog,,"Error|Information"]
  • eventlog[Application,,"Error|Information"]

Счетчики производительности

  • Проверка сетевых интерфейсов
  • Проверка кол-ва свободного места на дисках
  • Кол-во и использование ОЗУ/ЦПУ
  • Обще системные данные: аптайм, инфа о хосте, кол-во юзеров

В рамках тестирования на данный момент реализовал и частично проверил:

  • Мониторинг сайтов системы Directum, срабатывание тригеров на коды IIS отличающиеся от 200
  • Мониторинг выполнения сценариев в Планировщике Windows
  • Передача серверных логов системы
  • Мониторинг работы MS SQL Server в режиме Multi Instance 

 

Что хотелось бы реализовать дальше:

  1. Парсинг логов. Настройка регулярных выражений на критические ошибки в логах. Отработка тригеров по регуляркам
  2. Добавление Элементов Данных и тригеров мониторинга если система развернута в кластерном варианте, в том числе кластеризация веб продуктов Directum.
  3. Мониторинг DirectumRX, проверка работы сайтов, пулов приложения, планов обмена синхронизации с 1С и других.

Если есть желающие доработать шаблон, пишите буду рад.

Прикреплен файл: directum.xml
Прикреплен файл: ms sql.xml

26
Подписаться

Комментарии

В качестве идеи по развитию: отслеживать в идеале нужно не только статус "директумовских" служб, но и их возможное зависание.

Дополнительно можно добавить парсинг логов подключений сервера сеанса, с целью показать сколько пользователей работали в системе DIRECTUM.

Еще одна идея, которую можно реализовать: собирать данные по длительности операций, исходя из данных логов клиентского профайлинга системы DIRECTUM.

К слову, у меня получилось примерно следующее (цель была сделать не красиво и удобно, а быстро и с минимум затрат, в общем как всегда):


 

Для парсинга логов очень здорово использовать Splunk. 500 Мб в день бесплатно. Некоторые ECM системы разрабатывают для Splunk свои модули мониторинга - очень правильный подход.

Для графиков очень удобно использовать Grafana + influxdb. 

Павел Евдокимов: обновлено 31.07.2018 в 10:54
Авторизуйтесь, чтобы написать комментарий