Новые возможности для повышения эффективности интеллектуальной обработки в Directum RX

7 0

В 2021 году организации продолжают активно встраивать в свои бизнес-процессы искусственный интеллект, освобождая сотрудников от выполнения трудоемких ручных операций. Для поддержания этой тенденции в экосистеме интеллектуальных решений Directum RX регулярно разрабатываются инструменты, которые повышают качество и продуктивность автоматизированной обработки документов. Так, появилось новое решение «Фоновая индексация документов», а в логику подбора данных интегрированы алгоритмы нечеткого поиска с помощью Elasticsearch.

Фоновая индексация документов

Даже если компания давно внедрила и активно пользуется интеллектуальными сервисами, в системе могут оставаться документы, которые не передавались на обработку сервисам Ario. Это могло произойти с документами, которые:

  • занесли в систему до внедрения интеллектуальной обработки;
  • создали из файла или из других программ напрямую без обработки сервисами Ario.

В результате в системе скапливаются документы, у которых отсутствует текстовый слой. Искать их приходится по реквизитам, так как по слову или фразе их не найти. Поиск среди сотен документов с похожими реквизитами отнимает много времени. Решение «Фоновая индексация документов» находит и обрабатывает такие документы.

Как это работает?

Все, что нужно для запуска процесса, – это настроить расписание работы решения, а также виды и количество обрабатываемых за раз документов:

Настройки позволяют гибко масштабировать нагрузку на сетевые ресурсы организации. Например, можно запускать обработчик только по ночам или в выходные, а также настраивать отдельную линию для обработки, если основной сервис перегружен.

После запуска документы обрабатываются в фоновом режиме:

    1. Обработчик находит документы, последние версии которых не содержат текстового слоя и соответствуют заданным в настройках критериям.
    2. Документ поступает в Ario для извлечения текстового слоя.
    3. Обработчик возвращает в систему обработанный документ. Автоматически создается новая версия с извлеченным текстовым слоем в формате PDF.

В результате документ становится доступным для полнотекстового поиска, и сотрудник может быстрее найти его среди десятков одинаковых с похожими реквизитами.

Нечеткий поиск контрагента и адресата

При поступлении документа сервисы Directum Ario извлекают из текста факты, в том числе информацию об организации-отправителе (ИНН, КПП, наименование) и получателе (ФИО). На основании этих реквизитов система вычисляет контрагента и адресата.

Если из документа извлечены не все факты, и стандартный механизм поиска не дает результатов, в работу включается нечеткий поиск. Распознанные факты отправляются в Elasticsearch, где на их основании осуществляется поиск по сходству по всем записям в соответствующих справочниках.

Например, если в документе нет ИНН, КПП и наименование организации передаются в Elasticsearch. Он запускает процесс определения контрагента, подбирая нужное значение среди всех похожих записей справочников Организации, Персоны и Банки:

В итоге системе удается однозначно идентифицировать контрагента. Это исключает случаи, когда соответствующее поле в карточке документа остается незаполненным.

Бизнес-эффект

  • сокращается время на заведение документов в систему, так как определение контрагента и адресата происходит автоматически. Сотрудникам не требуется сличать информацию с источника и вносить эти данные вручную;
  • упрощается поиск документов за счет дополнительного извлечения текстового слоя. В результатах поиска отображаются даже те документы, которые были занесены в систему до внедрения интеллектуальных сервисов Ario или без их применения.

***

Подробную информацию об интеллектуальных решениях Directum RX можно узнать в службе поддержки Directum по тел. +7(3412)72-67-06 или по электронной почте support@directum.ru.

Остались вопросы? Оставляйте комментарии и ваши предложения!

Пока комментариев нет.

Авторизуйтесь, чтобы написать комментарий