Комплексная интеллектуальная обработка входящих писем и обращений граждан в Правительстве Тюменской области

87%

корректность заполнения реквизитов карточки входящего письма

70%

точность определения вопроса в обращениях граждан

на 50%

сократилось время обработки одного документа

Следующий проект

О компании

Правительство Тюменской области использует продукты компании Directum уже 14 лет. Все региональные и муниципальные органы власти региона, государственные учреждения работают в Directum RX. Охват системы — более 800 организаций и 24 тыс. сотрудников.

Правительство Тюменской области одно из первых:

  • развернуло Directum RX в инфраструктуре полностью импортонезависимого ПО – от ОС до текстовых и табличных редакторов;
  • провело полноценную интеграцию региональной СЭД с ПОС с помощью СМЭВ и обработки обращений граждан из ПОС по 59-ФЗ;
  • реализовало собственную функциональность по кадровому электронному документообороту.

Регулярно участвует в конкурсе Directum Awards со своими кейсами.

Развитие системы в Тюменской области продолжается и охватывает новые области деятельности госорганов.

Предпосылки проекта

Каждый день в органы государственной власти региона поступает множество документов, они делятся на два основных потока:

  • официальные письма;
  • обращения граждан.

Оба вида документов обрабатываются по своим правилам, закрепленным на федеральном уровне и зафиксированным в 59-ФЗ. Но есть и общее — документ и приложения к нему нужно занести в систему. А после — заполнить карточку с реквизитами.

Чтобы обработать обращения граждан, специалист вычитывает текст, определяет вопрос по Типовому общероссийскому тематическому классификатору (а это 1221 вопрос!), выгружает результаты рассмотрения обращений на портал ССТУ. Далее информация анализируется и контролируется в разрезе этих вопросов (Указ Президента РФ № 171 от 17.04.2017г. «О мониторинге и анализе результатов рассмотрения обращений граждан и организаций).

Если документы поступают по МЭДО, через ПОС, с Портала услуг Тюменской области или из интегрированных с Directum RX систем, то пользователям не нужно выполнять большинство из перечисленных действий. Карточка документа создается и заполняется автоматически, с ней связывается документ и приложение. В ряде случаев в систему передается информация о вопросах для обращений граждан, остается только направить документ в работу.

Однако при поступлении документов на официальную электронную почту или в бумажном виде регистрировать их приходится вручную. В итоге тратится большое количество времени. Чтобы сократить рутину, Правительство Тюменской области использует искусственный интеллект.

Цели и задачи проекта

Цифровизация операций с применением интеллектуальных инструментов:

  • занесение в систему документов, поступающих в организации в бумажном виде и по электронной почте;
  • классификация документов по типам (входящее (официальное) письмо, обращение гражданина или простой документ);
  • заполнение основных реквизитов карточки входящего письма;
  • определение вопросов по общероссийскому тематическому классификатору в обращениях граждан.

Задачи:

  • обучить ML-модель классификации документов по типу;
  • проверить и при необходимости дообучить ML-модель извлечения фактов для входящих писем;
  • обучить ML-модель классификации обращений граждан по вопросам общероссийского тематического классификатора;
  • нормализовать справочник «Организации». Реализовать механизм поиска и удаления дублирующих и устаревших записей, чтобы система автоматически заполняла нужного корреспондента во входящих письмах;
  • добавить в стандартную задачу на верификацию возможности, которые доступны делопроизводителям в других задачах: переформирование во входящее письмо/обращение в один клик и отказ в регистрации для входящих писем.

Важно, чтобы новая функциональность органично встроилась в существующие процессы работы и не осложняла работу пользователей.

Применяемые технологии

  • ИИ-инструменты (извлечение, распознавание и классификация текстового слоя);
  • нечеткий поиск с использованием Elasticsearch;
  • no-code;
  • занесение документов с помощью Directum Capture Service.

Ход проекта

Проект длился с сентября по декабрь 2024 года. На данный момент идет тиражирование функциональности на органы исполнительной власти региона.

Исследование и проектирование.

В ходе этого этапа изучили формы документов, особенности их поступления и занесения в разных организациях.

Собрали статистику по вопросам обращений граждан за последние 5 лет: какие вопросы наиболее часто встречаются в обращениях и сколько из них необходимо включить в классификатор, чтобы охватить максимальное количество вопросов как по отдельным организациям, так и по совокупности в целом.

Провели демонстрацию коробочной функциональности для ключевых пользователей, чтобы собрать обратную связь. На основании полученной информации разработали проектные решения.

Отбор документов и обучение моделей и классификаторов.

На этом этапе определили необходимое количество документов и критерии, по которым их необходимо выгружать из продуктивной системы для проведения обучения. Далее выполнили выгрузку, после чего коллеги из Directum провели обучение и тестирование. Сделали несколько итераций для достижения наилучшего результата.

Настройка и адаптация системы.

Разработчики Directum реализовали поиск, замену в документах и удаление дублей записей справочника «Организации», новую задачу на верификацию, модифицировали процесс захвата документов из электронной почты и «горячей» папки, добавили ряд доработок для узкоспециализированных кейсов (например, извлечение и распознавание текста электронного письма, алгоритм определения ведущего документа в комплекте, дополнительные условия для поиска и закрытия дублей справочника «Организации» и т.д.).

Пилотирование решения.

Пилотирование решения прошло в Департаменте Информатизации и Центре информационных технологий Тюменской области.

Делопроизводители обрабатывали реальную корреспонденцию с использованием механизмов Ario, давали обратную связь по скорости и точности занесения документов, классификации и заполнению реквизитов карточек. На основании этой информации вносились правки в конфигурацию системы, выполнялось дообучение моделей и классификаторов.

Описание интеллектуальной обработки документов

Все входящие письма и обращения граждан, которые поступают по электронной почте или в бумажном виде, обрабатываются по схеме:


После распознавания текста и извлечения фактов сервисы искусственного интеллекта автоматически классифицируют документы по типу – входящее письмо или обращение гражданина. Для входящих писем автоматически заполняются следующие реквизиты карточки:

  • Содержание;
  • Корреспондент;
  • Дата от;
  • №;
  • Подписал;
  • Контакт (Исполнитель по документу);
  • Адресат;
  • В ответ на.

Для извлечения реквизитов используется модель, входящая в комплект поставки Directum RX Intelligence. Специально для проекта ее дообучили на документах, характерных для госорганов. Это улучшило качество заполнения реквизитов.

В корреспонденции достаточно часто встречаются судебные повестки по форме 30-СДП, которая отличается от стандартной формы входящего письма. Так как таких документов много, то было принято решение обучить для них отдельную модель извлечения фактов. Провели эту работу совместно с коллегами из Directum.

Если на обработку поступило обращение гражданина, то по Общероссийскому тематическому классификатору определяются вопросы, к которым его можно отнести. Для этого используется multi-label-классификация, то есть для каждого обращения определяется не один вопрос, а три наиболее подходящих по смыслу. В зависимости от вероятности принадлежности обращения к этим вопросам в карточке обращения может быть заполнен один, два, три вопроса или не заполнено ни одного. При этом границы вероятностей настраиваются в специальном справочнике, вопросы, которые определили ИИ-сервисы, все равно отображаются для пользователя в виде хинта-подсказки. Кроме того,
если обращение поступило с сопроводительным письмом, то регистрационные данные и корреспондент подтягиваются в соответствующие поля карточки обращения.

Для задания на верификацию документов предусмотрен удобный интерфейс, в котором можно:

  • одновременно просматривать образ документа и его карточки
  • определять точность извлечения фактов по интуитивно-понятному цветовому выделению.


 

Делопроизводителю доступны все необходимые действия для работы с документами – перекомплектование, удаление лишних документов, смена типов документов, отправка уведомлений о получении обращения по электронной почте, автоматическая простановка визуальной отметки о регистрации на документ и т.д.

После проверки документов и автоматически заполненных реквизитов делопроизводителю остается только отправить документ в работу.

Одновременно с этим в системе в фоновом режиме работает механизм поиска и удаления дублей контрагентов из справочника «Организации». Общий алгоритм работы механизма следующий:

  1. В рамках работы специального фонового процесса (ФП) с использованием механизмов нечеткого поиска ElasticSearch идет поиск организаций, которые точно являются или могут являться дублями. Основные реквизиты, по которым выполняется поиск:
  • ИНН;
  • КПП;
  • наименование;
  • способ обмена.

По результатам работы ФП каждой организации может быть присвоен один из статусов: «Оригинал», «Дубль» и «Возможно дубль». Если системе не удалось однозначно определить, является ли организация дублем, то сотрудникам, указанным в специальной роли, приходит задание на ручную обработку организации-оригинала и возможных дублей. Сотруднику остается только проверить, являются ли дублями организации в задании, установить для них соответствующий статус и указать оригинал. За счет использования нечеткого поиска удается находить похожие записи, даже если их наименования не совпадают полностью или часть данных отсутствует. Задача на ручной разбор дублей реализована с использованием no-code, поэтому может быть настроена под потребности пользователей без разработки.


Верхнеуровневый алгоритм поиска дублей

  1. В карточки организаций добавлены поля «Оригинал» и «Статус обработки дублей», в которых фиксируются результаты работы ФП по поиску дублей и выполнения заданий на ручной разбор дублей. Задача еще одного фонового процесса – заменять ссылки на организации-дубли ссылками на оригиналы в карточках документов и справочников. При этом если к дублирующей организации были привязаны контактные лица, они подтягиваются к оригинальной организации.
  2. Наконец, третий фоновый процесс удаляет организации со статусом «Дубль» из системы. Такой механизм позволяет как выполнить первоначальную нормализацию справочника «Организации», в котором часто бывает много лишних записей, так и минимизировать вероятность их появления в дальнейшем.

Таким образом, в рамках проекта нам удалось реализовать как обработку документов с использованием ИИ-инструментов, так и механизм, повышающий качество данных, на основании которых выполняется заполнение реквизитов.

Трудности, с которыми мы справились

Конечно, подобные инновационные проекты всегда сопряжены со сложностями и этот не стал исключением. Вот некоторые из них:

  • для обучения классификаторов нам требовалось выгружать огромное количество документов из системы. Такие выгрузки необходимо делать периодически – для первоначального обучения, тестирования, дообучения и т.д. Ручная выгрузка – длительный процесс, тратить на него ресурсы квалифицированных специалистов нецелесообразно. Для выхода из ситуации специалисты Directum разработали уникальный механизм автоматической выгрузки документов по критериям;
  • при тестировании классификатора по вопросам результаты по некоторым из них были значительно хуже остальных. В этих случаях аналитики изучали тексты обучающей и тестовой выборок для исключения обращений, которые негативно влияли на качество классификатора;
  • в тексте электронного письма иногда содержится служебный текст, который может быть ошибочно классифицирован как часть обращения или входящего письма. Для исключения подобных случаев реализована специальная обработка, отчищающая электронное письмо от подобных «помех» для более корректной классификации и определения ведущего документа в комплекте.

Результаты

Цели и задачи, поставленные на старте проекта, достигнуты. Что сделали:

  • автоматизировали занесение, классификацию и заполнение реквизитов карточек входящих писем и обращений граждан, которые поступают в организации по электронной почте и на бумаге;
  • обучили классификаторы по типу документов, первых страниц, по вопросу в обращениях граждан;
  • обучили модели извлечения фактов для входящих писем и судебных повесток;
  • разработали механизм поиска и удаления дублей в справочнике «Организации»;
  • настроили механизм автоматической выгрузки документов для обучения моделей и классификаторов.

Уникальность проекта

  • для определения вопросов в обращениях граждан впервые среди подобных проектов применили multi-label классификатор для 69 классов, который настроен для заполнения до трех вопросов в обращении;
  • извлечение текста и фактов производится не только из вложенных документов, но и из текста самого электронного письма;
  • реквизиты карточки обращения гражданина могут заполняться из извлеченных фактов сопроводительного письма;
  • механизм поиска и удаления дублей применяется в справочнике «Организации» с использованием нечеткого поиска, в том числе, по наименованию организации.

Планы по развитию

Данный проект – это наш первый опыт встраивания искусственного интеллекта в рабочие процессы. Сейчас в планах:

  • тиражировать использование интеллектуальных механизмов обработки документов на другие органы власти и местного самоуправления региона;
  • реализовать автоматическое дообучение классификаторов;
  • внедрить технологии генеративного искусственного интеллекта (LLM) в Directum RX для подготовки аннотаций к документам, проектов ответных писем, резолюций, снижения рутины и ошибок при обработке документов;
  • подключить «помощника руководителя» для формирования проектов резолюций и определения ответственного, повышения эффективности работы и снижения временных затрат руководителей всех уровней.

Команда проекта

Сотрудники Департамента информатизации Тюменской области

  • Кошелева Елена Артуровна — начальник отдела информационных систем и проектов
  • Крылов Евгений Александрович — главный специалист отдела информационных систем и проектов

Сотрудники ГКУ ТО «ЦИТТО»

  • Царикаев Рустам Рамазанович — заместитель директора 
  • Пащенко Роман Александрович — начальник управления межведомственных информационных систем 
  • Штиглиц Евгений Константинович — специалист управления межведомственных информационных систем 

Представители Directum

  • Краснопёров Дмитрий Витальевич — руководитель проекта
  • Калабина Мария Алексеевна — аналитик
  • Щеденко Алексей Владимирович — консультант
  • Чурбаков Иван Александрович — разработчик
  • Подлевских Татьяна Александровна — разработчик
  • Плетенев Юрий Алексеевич — разработчик
  • Королева Екатерина Андреевна — аналитик данных
  • Мурзаева Анастасия Сергеевна — аналитик данных
Пока комментариев нет.
Авторизуйтесь, чтобы написать комментарий

У вас похожая задача?

Обсудите реализацию с экспертом Directum

Обязательное поле
Обязательное поле
Обязательное поле
Обязательное поле
Обязательное поле
Обязательное поле

Благодарим за интерес! Мы свяжемся с вами.

Directum Awards 2025
Какой проект лучше?
Авторизуйтесь, чтобы оценить материал.
Авторизуйтесь, чтобы оценить материал.
Directum Awards 2024
Спасибо за активность!
Ваш голос принят