В ИТ-инфраструктуре своей организации я использую множество различных хостов на Windows/Linux/Unix OS. Все многообразие сервисов мониторится через систему Zabbix. Встала необходимость реализации мониторинга корпоративной системы Directum. Стандартные шаблоны Zabbix "Template OS Windows " хорош, но в нем слишком много всего подгружается из системы. Настроен автодисковер служб, нет элементов данных по считыванию логов с сервера.
Описания по установке самого Zabbix здесь не будет, их много в сети.
Итак сделал свой шаблон мониторинга на основе доработанного дефолтного "Template OS Windows ".
Включил мониторинг служб:
SBSessionServer
SBWorkflowProcessingServer
SBFileStorageService
DirectumInterchangeSystemsIntegration
DicsAgentService
DCTSCaptureService
DCTSTransformationService
DTSTransformationService_2
DTSTransformationService_3
SBEventProcessingService
WebAccessAgentSvc
Ario Classifier Service
Ario Fact Extractor Service
SQLBrowser
SQLWriter
MSSQLSERVER
IISADMIN
Добавил логирование Windows Журналов
eventlog[DAC Event Log,,"Error|Information"]
eventlog[DICS EventLog,,"Error|Information"]
eventlog[System,,"Error|Information"]
eventlog[Dcts EventLog,,"Error|Information"]
eventlog[Application,,"Error|Information"]
Счетчики производительности
Проверка сетевых интерфейсов
Проверка кол-ва свободного места на дисках
Кол-во и использование ОЗУ/ЦПУ
Обще системные данные: аптайм, инфа о хосте, кол-во юзеров
В рамках тестирования на данный момент реализовал и частично проверил:
Мониторинг сайтов системы Directum, срабатывание тригеров на коды IIS отличающиеся от 200
Мониторинг выполнения сценариев в Планировщике Windows
Передача серверных логов системы
Мониторинг работы MS SQL Server в режиме Multi Instance
Что хотелось бы реализовать дальше:
Парсинг логов. Настройка регулярных выражений на критические ошибки в логах. Отработка тригеров по регуляркам
Добавление Элементов Данных и тригеров мониторинга если система развернута в кластерном варианте, в том числе кластеризация веб продуктов Directum.
Мониторинг DirectumRX, проверка работы сайтов, пулов приложения, планов обмена синхронизации с 1С и других.
Если есть желающие доработать шаблон, пишите буду рад.
Для парсинга логов очень здорово использовать Splunk. 500 Мб в день бесплатно. Некоторые ECM системы разрабатывают для Splunk свои модули мониторинга - очень правильный подход.
Для графиков очень удобно использовать Grafana + influxdb.
В качестве идеи по развитию: отслеживать в идеале нужно не только статус "директумовских" служб, но и их возможное зависание.
Дополнительно можно добавить парсинг логов подключений сервера сеанса, с целью показать сколько пользователей работали в системе DIRECTUM.
Еще одна идея, которую можно реализовать: собирать данные по длительности операций, исходя из данных логов клиентского профайлинга системы DIRECTUM.
К слову, у меня получилось примерно следующее (цель была сделать не красиво и удобно, а быстро и с минимум затрат, в общем как всегда):
Для парсинга логов очень здорово использовать Splunk. 500 Мб в день бесплатно. Некоторые ECM системы разрабатывают для Splunk свои модули мониторинга - очень правильный подход.
Для графиков очень удобно использовать Grafana + influxdb.
Всем привет, а уже более свежий шаблон есть?
Авторизуйтесь, чтобы написать комментарий