Интеллектуальные сервисы Directum Ario 2021.2. Что нового?

8 3

Сервисы интеллектуальной обработки документов Directum Ario продолжают активно развиваться и совершенствоваться. В этой статье мы расскажем о новинках, появившихся в версии 2021.2. Поехали!

Извлечение фактов из таблиц

В основе большинства первичных бухгалтерских документов, поступающих в организацию, лежат таблицы. Такие таблицы содержат значимые факты, например, общую сумму документа и сумму НДС. Раньше для извлечения фактов из таблиц нужно было разрабатывать специальные правила. В новой версии Directum Ario можно подготовить модели распознавания табличных данных с помощью машинного обучения.

Для обучения используются наборы данных с размеченными таблицами. Их можно подготовить в инструменте разметки AVIA, в который добавлена возможность работы с таблицами. В несколько кликов можно разметить отдельную ячейку или диапазон ячеек:

Разметка табличных данных в товарной накладной с помощью AVIA

Размеченные табличные данные экспортируются в формате BIO вместе с текстовыми данными. При обучении моделей для них указываются специальные признаки, по которым сервисы Ario с высокой точностью определяют расположение фактов в таблицах при обработке документов.

Удобная настройка атрибутов

В новой версии не остался без внимания и интерфейс инструмента разметки: в AVIA появилось окно редактирования атрибутов. В нем еще удобнее настраивать существующие атрибуты или создавать новые:

Редактор атрибутов AVIA

Для атрибутов можно указать два слоя. Например, в товарных накладных номера документов могут быть указаны как в тексте, так и в табличной части. Размечать их будет удобнее, если для атрибута «Номер документа» указать и текстовый, и табличный слой.

Кроме того, теперь можно быстро проверить корректность извлечения текстового слоя или таблиц. Для этого достаточно нажать клавишу ALT: на табличном слое подсветятся все ячейки таблиц в документе, на любом другом слое – весь распознанный текст:

Подсветка текста и таблиц в AVIA

Новые рекомендации для оборудования

В версии 2021.2 пересмотрены рекомендации по конфигурации оборудования в зависимости от объема входящего документопотока:

  • Если в компанию поступает менее 90 000 документов в месяц, рекомендуется устанавливать все сервисы Ario на один сервер.
  • Если объем поступающих документов превышает 90 000 документов в месяц, сервис Directum Text Extractor Service следует вынести на отдельный сервер. В таком случае для обеспечения лучшей отказоустойчивости также рекомендуется вынести ряд и других сервисов Ario на отдельные сервера или виртуальные машины. Подробности – в документации Directum Ario.

***

Подробную информацию о сервисах Ario можно узнать в службе поддержки Directum по тел. +7(3412)72-67-06 или по электронной почте support@directum.ru.

Ждем ваши вопросы, комментарии и предложения!

Роман Панихин

Отслеживаю изменения которые происходят с интеллектуальными сервисами Directum Ario и они радуют т.к. число охватываемых интеллектом процессов, и качество результатов при использовании сервисов непременно наращивается, и возрастает.

Но я ни разу в описаниях Ario или во внедряемых проектах не встречал применение сервисов для проверки правильности оформления документов (например, УПД или иной первичной бухгалтерской документации) на соответствие действующему законодательству и полноту сведений (полей) обязательных для заполнения.

Поэтому вопрос: в данном случае Directum не рассматривает и не позиционирует эти возможности по использованию сервисов или это не востребовано в бизнес-среде? А может на данный момент невозможно или я что-то пропустил?

На практике отсутствие подобных проверок приводит к негативным результатам. Например, «хороший» главный бухгалтер перед принятием к учету входящих документов, организует процесс их проверки. Если этого не сделать сразу, то можно пострадать при проверках налоговым органом или потерять время на переоформление документов.

Возможно подобный кейс будет актуален при передаче документов в архив или при проверке на правильность заполнения документа на этапе старта его согласования «по типовому маршруту».

Виталий Астраханцев

Роман, спасибо за обратную связь!

По кейсу нормоконтроля мы действительно рассматриваем возможность анализа формата документов с помощью интеллектуальных сервисов, но это кейс сейчас на этапе исследования  и наиболее приоритетные направления здесь все же договорные документы и ОРД.

Роман Панихин

Виталий, спасибо.

Авторизуйтесь, чтобы написать комментарий