Голосовой чат-бот для внутренних процессов ООО «Акелон»

Исполнитель: ООО "Акелон"
Тэги:

Голосовой чат-бот для внутренних процессов ООО «Акелон»

В наши дни становится естественно разговаривать с электронными устройствами. Поддержка голосового управления уже появилась в телефонах, компьютерах, колонках и автомашинах. По прогнозам Strategy Analytics и Canalys на начало 2019 года доступ к голосовым помощникам будет у половины всех смартфонов, а число умных колонок по всему миру превысит 100 миллионов. Широкое распространение голосовых ассистентов подогревает коммерческий интерес компаний к аудиоинтерфейсам. Всё чаще компании стремятся их использовать как новый канал продаж.

Подхватив общий технологический тренд, мы решили посмотреть, как можно использовать голосовых помощников для взаимодействия с системой электронного документооборота.

При этом в первую очередь ассистент должен помогать выполнять ежедневные задачи сотрудников. А чтобы повысить эффективность их выполнения, взаимодействие с ботом должно быть не сложнее, чем в стандартном интерфейсе ECM-системе. Все сценарии использования должны быть направлены на упрощение сложных, а иногда и бюрократических процессов для сотрудников.

Ожидаемый эффект

  • снижение рутинных операций во внутренних процессах
  • снижения бюрократизма
  • возможность поддержать имидж инновационной компании

Сценарии использования

Для простоты будем считать, что голосовой помощник (голосовой ассистент) - это программа, которая выполняет различные голосовые команды в режиме реального времени. Самые популярные голосовые ассистенты: Alexa от Amazon, Siri от Apple, Google Assistant, Алиса от Яндекс.

Все голосовые помощники поддерживают несколько базовых команд или сценариев использования: найти информацию в интернете, поставить музыку, заказать такси, завести будильник, поиграть в игру. Возможности голосового ассистента можно расширять своими собственными сценариями. Основная трудность состоит как раз в придумывании этого сценария.

Голосовое взаимодействие подразумевает полное или частичное отсутствие экрана. У пользователя не будет привычного графического интерфейса и ему всю информацию придётся воспринимать на слух. Поэтому невидимый помощник должен быть максимально простым, ему не нужно учится, с ним можно построить диалог как мы привыкли разговаривать друг с другом.

При этом в первую очередь ассистент должен помогать выполнять ежедневные задачи сотрудников. А чтобы повысить эффективность их выполнения, взаимодействие с ботом должно быть не сложнее, чем в стандартном интерфейсе ECM-системе. Все сценарии использования должны быть направлены на упрощение сложных, а иногда и бюрократических процессов для сотрудников.

Следует помнить об уместности использования аудиоинтерфейсов - никто не любит, когда его подслушивают. Здесь важно каким образом пользователь будет общаться с голосовым устройством. Так мы отталкивались от двух контекстов взаимодействия:

Общий доступ. Взаимодействие осуществляется через умную колонку, которая установлена в офисе и ей может воспользоваться любой сотрудник. При проектировании сценариев для такого использования необходимо учитывать уровень конфиденциальности информации.

Персональный доступ. Открытое взаимодействие, пользователь может не бояться, что кто-то его услышит. Например, в своём кабинете или даже у себя дома.       

Исходя из данных принципов, мы посмотрели на функции ECM-системы и придумали сценарии взаимодействия, которые разделили на несколько групп в зависимости от степени участия в них системы.

1. «Вопрос-ответ» к справочной информации (документам)

К этой группе мы отнесли сценарии “вопрос-ответ”. Давайте представим, что новый сотрудник нашей компании решил оформить командировку в DIRECTUM, но не знает, как это сделать. Или действующий сотрудник сталкивается с подобной задачей в первый раз, а может быть он просто забыл, как это делать. Таких ситуаций достаточно много, например:

  • Как оформить отпуск?
  • Как оформить командировку?
  • Кому отправить приказ на согласования?
  • Как оформить служебную записку?
  • Где взять актуальный бланк для заявление?
  • и т.п.

 

Преимущество подобных сценариев заключается в том, чтобы ими пользоваться достаточно задать вопрос, так как вы бы задали его коллеге (на естественном языке). Не требуется читать инструкции.

С другой стороны, данный факт может сформировать у пользователя ложное ощущение, что бот знает ответ на любой вопрос, как бы он его не сформулировали. Поэтому важно продумать варианты, при которых помощник возвращал бы диалог в нужное русло или рассказывал, что он умеет.

Постепенно с помощью ассистента можно закрыть большинство организационных вопросов, с которыми сталкивается сотрудник в работе.

2. Сценарии с использованием объектов DIRECTUM

Ко второй группе мы отнесли кейсы, в которых затрагиваются ключевые функции DIRECTUM: работа с документами и задачами.

Мы сразу отбросили сценарии по голосовому заполнению карточки или ввода критериев поиска документов. Очевидно, что делать это голосом долго и не удобно. Еще менее реальным выглядит голосовое согласование или подписание документа электронной подписью.

Мы решили подумать, какие операции мы часто выполняем в ECM-системе, и при этом нам не обязательно смотреть в экран? Зачем мы открываем почтовый клиент или проводник ECM-системе, даже если не собираемся там ничего делать?

Часто мы делаем это только для того, чтобы узнать, есть ли новые сообщения во входящих. Поэтому, мы научили нашего бота зачитывать новые входящие задания.

Голосовой интерфейс должен быть предсказуемым, пользователь в любой момент должен понимать, что от него ожидает программа. Иначе помощник будет раздражать, а не помогать. Чтобы объяснить пользователю, что он может прослушать следующее входящее задание, каждый раз бот спрашивает: “Прочитать следующее?” до тех пор, пока не останется непрочитанных заданий или пользователь самостоятельно не прекратит выполнение сценария.

Бот может делиться и другой информацией по задачам, которая хорошо воспринимается на слух. Представим, что руководитель подразделения, хочет узнать, как хорошо работают в системе его сотрудники. С помощью простых голосовых команд он может узнать, сколько задач выполнил в этом месяце Иванов или сколько просроченных задач было в моем отделе.

Плюс такого подхода в том, что не нужно тратить время на поиск информации в DIRECTUM.

В DIRECTUM хранится и другая категория справочной информации, к которой мы периодически обращаемся. К такой информации мы отнесли:

  • Кто замещает руководителя?
  • В каком подразделении работает сотрудник?
  • Какой телефон у бухгалтера, юриста и т.п.?
  • и т.д.

Поиск ответов на эти типовые вопросы можно поручить боту. Эта задача похожа на первую группу кейсов, но ответы формируются на основе данных системы DIRECTUM.

В эту же группы мы включили сценарии, в результате которых наш бот создаёт простые объекты системы. Например, отправляет простую задачу или короткое поручение подчиненному.

3. Запуск заявок от сотрудников

Наверное, каждый из нас звонил в техническую поддержку, потому что не запускается какое-нибудь корпоративное приложение, или обращался в отдел бухгалтерии, чтобы получить справку о заработанной плате. При помощи голосового помощника сотрудники смогут отправлять подобные заявки голосом. Ассистент задаст несколько вопросов и отправит заявку в нужную службу. Пользователю не придётся искать форму подходящей заявки, заполнять поля или же звонить ответственным специалистам.

В результате в DIRECTUM создаётся заявка и задача для службы сервиса, а после выполнения пользователю поступит email.

 

Ещё одна вариация данной группы сценариев – заявка на корпоративную машину с водителем. Заказ такси это, пожалуй, классический кейс для голосовых помощников: сказать адрес голосом гораздо проще и быстрее, чем вводить его на клавиатуре.

4. Кадровые и административные процессы

Рассмотрим последнюю категорию сценариев. Это может быть интеграция с системой, не важно ECM или ERP, в которой реализованы кадровые и административные процессы: прием, отпуска, командировки и пр., расчет премий и зарплат, управление задачами подразделений и проектное управление.

К таким задачам, которые с которыми справятся говорящие помощники, можно отнести запуск автоматизированных процессов, например, оформление отпуска, командировки и т.п.

Количество и проработка сценариев данной группы зависит от степени автоматизации процессов компании. Вот ещё несколько сценариев, которые мы придумали для нашего корпоративного помощника:

  • Узнать, когда из отпуска или командировки возвращается сотрудник;
  • Узнать что-то про сотрудника: когда день рождения, сколько лет работает и т.д.;
  • Спросить про свою зарплату: когда дадут, какую премию я получу в этом месяце;
  • Внести отметку по выполненным работам;
  • Узнать статус проекта.

Архитектура решения

Голосовой бот – это достаточно технологичное решение, которое состоит из нескольких компонент. На рисунке приведена архитектура нашего решения.  

  1. Во-первых - это само устройство, через которое пользователи говорят или слушают ответы. Это может быть телефон, умная колонка или компьютер.
  2. Во-вторых - это голосовой помощник. Это непосредственно тот агент, который переводит ваш голос в конкретные команды, а также синтезирует ответную речь. Мы выбрали Алису от Яндекс, но схема с другими помощниками, например, Google Assistent, принципиально не поменяется.
  3. Для того, чтобы научить голосового помощника новым командам, сторонние разработчики интегрируют их со своими приложениями. Интеграция происходит с помощью расширений. У Алисы эти расширения называются “Яндекс Диалоги”, у Alexa - “Skills”, у Google Assistent - “Action”.
  4. Сама платформа Яндекс Диалоги бизнес-логики не выполняет, а является прокси, который позволяет подключать к Алисе сторонние приложения (чат боты) с логикой вопросов-ответов. Несмотря на кажущуюся простоту диалогов бота, реализация разговора (вопросы, ответы, переходы) не такая тривиальная задача.
  5. Для разработки нашего бота мы использовали платформу Aimylogic – конструктор интеллектуальных чат-ботов. Платформа позволяет собирать ботов, которые умеют понимать запросы пользователя на естественном языке, распознавать синонимы, словоформы, а также извлекать данные из фраз. Самое главное – это то, что у Aimylogic есть отличный конструктор диалогов. Он позволяет в визуальном режиме задавать логику диалогов: фразы, переходы, варианты вопросов и ответов. Настройку конструктора легко освоил наш аналитик.
  6. Наконец последняя составляющая решения – это система DIRECTUM. Взаимодействие осуществляется посредством вызова сценария через веб-сервис DIRECTUM. Для этого в конструкторе Aimylogic есть специальный блок отправки HTTP запроса. На каждый сценарий интеграции мы реализовали собственный сценарий DIRECTUM. Пример запроса к DIRECTUM для получения сведений о плановом отпуске:

Чтобы навык начал работать в Алисе, необходимо его зарегистрировать на платформе Яндекс Диалоги и подключить созданный бот. Для публикации нужно придумать активационную фразу, например, “Запусти корпоративный бот Акелон” и пройти модерацию. Подробно о требованиях к публикации навыков можно прочитать на сайте документации платформы Яндекс.Диалоги.

Яндекс Диалоги ориентированы по большей части на взаимодействие с внешними клиентами и не предназначены для использования внутри компании. Это проявляется в двух проблемах:

  1. Отсутствие удобной авторизации пользователя по голосу. Сложно представить себе корпоративное приложение без авторизации. На текущий момент Алиса поддерживает возможность передавать mac-адрес устройства. Конечно, можно построить схему авторизации и на этой информации, но она точно не подходит для публичной колонки в офисе.
  2. Время отклика не больше секунды. Если DIRECTUM не ответит на запрос в течении этого времени, то пользователи Алисы увидят сообщение о том, что навык не отвечает.

Amazon уже выпустил на рынок сервис, благодаря которому сотрудники организации могут использовать Alexa в повседневной работе, ждём подобного сервиса от Яндекса.

Перспективы реализации

Учитывая предполагаемое сокращение рутинных операций в нашей компании и трудоёмкость реализации сценариев голосового чат-бота наиболее приоритетными для реализации сценарии:

  • Простые заявки и заявления – на техподдержку или на отпуск
  • Ответы на вопросы

Менее перспективные:

  • Сложные заявки, которые требуют от пользователя много информации, например, оформление командировок

Для других компаний приоритеты будут зависеть от частоты операций по сценариям и важности для бизнеса.

На рынке имеются продукты и технологии для реализации решения. Мы доказали себе жизнеспособность идеи голосового интерфейса для DIRECTUM, поэтому создавайте своих ботов, и голосовые помощники будут решать ваши задачи.

Команда проекта

  • Евтисов Станислав, руководитель проекта
  • Столярова Мария, аналитик
  • Тайсин Александр, разработчик
Номинация: Neo
Организация: ООО "Акелон"
47
Подписаться
Опубликовано:
11 января 2019 в 10:24
  • Утверждено
  • 6

Комментарии

Мелочи:
> Google Assistent 
Правильно будет "Google Assistant"

> Яндекс Диалоги
Правильно будет "Яндекс.Диалоги"

> Время отклика не больше секунды.
Конкретно с Яндекс.Диалогами не работал, но обычно это не проблема. Операции должны быть асинхронными. Получить токен/хуку запроса, если запрос не быстрый ответить "Сейчас посмотрю", и ответ "докинуть" позже.

> Отсутствие удобной авторизации пользователя по голосу. 
Это никак не связано с "взаимодействие с внешними клиентами", даже дома, чтобы поставить напоминалку на телефон, прочитать планы на день или отправить сообщение - нужно распознавание собеседника. Дома использую Google Home, и он понимает кто с ним общается.

> Основная трудность состоит как раз в придумывании этого сценария.
"придумывать", всё же некорректный термин, сценарии определяют/выявляют. Придуманный сценарий никому и не нужен.

Как активный пользователь голосовых ассистентов поделюсь своей позицией. Голосовой ассистент дома - это очень удобно. И основная причина этого удобства - он помогает выполнять периферийные задачи без отрыва от "основного производства". Если ты готовишь ужин он поможет поставить таймер, закинуть в список покупок заканчивающийся продукт, включить музыку, отправить сообщение родственнику, что скоро ужин. То есть сделать процесс готовки максимально комфортным. Домашних примеров могу подкинуть достаточно много.

Транслировать кейсы на рабочую обстановку, как мне кажется, нужно аналогичным образом. Очень хорошо подходят разъездные кейсы: в машине (сам за рулём), в полях (приёмка объектов) и т.д. То есть внимание надо уделять ситуациям когда использование DIRECTUM будет "отвлечением". Примеры в статье правильные, но, как мне показалось, фокус применения отсутствует, поэтому решил поделиться. 

Немного впечатлений от контакта с голосовыми ботами.

Понадобилось мне узнать расписание пригородной электрички, но под руками не было интернета. Звоню в справочную РЖД (+7-800-775-00-00), слушаю стандартные информационные сообщения робота и тут слышу: "Произнесите ваш вопрос ...". "Аха!" - говорю - "Магия! Искусственный интеллект!"

В общем, разговор с ним у меня был долгим и обстоятельным. Магия улетучилась через минуту. Да, я получил ответы на свои вопросы, но не получил большого удовольствия от процесса. Потратил минуты 4-5, тогда как при наличии интернет потратил бы не более минуты.

К чему это я? Безусловно, голосовые ассистенты - это технологический тренд, который надо ловить и развивать. Но каким бы ни был сценарий использования, главным критерием его успешности будут меньшие или сопоставимые затраты времени и усилий на выполнение операций конечным пользователем. Есть над чем работать.

А описанные кейсы - классные! Молодцы!

Идея и реализованные кейсы отличные! Но например, у голосового помощника Алиса есть возможность не диктовать вопрос, а выбрать из примеров вопросов или часто возникающих вопросов или напечатать его вручную. Примеры вопросов указываются в нижней части экрана, а рядом располагается клавиатура для ввода вопроса. В вашем голосовом боте будет возможность напечатать возникший вопрос или выбрать вопрос из готового списка вопросов? 

Юлия, да так сделать можно, причем достаточно просто: поскольку для создания бота мы используем платформу Aimylogic то достаточно, чтобы она поддерживала эту функцию. А она её поддерживает )

Если запустить сейчас Алису на телефоне и сказать ей: "Алиса запуски корпоративный бот АКЕЛОН" то вы увидите эти кнопки.

Но все же основной кейс который мы рассматривали в статье  - это полностью голосовой интерфейс, например при запуске через Яндекс Станцию. Кстати станция нашего бота не запускает как раз потому, что в нем есть эти кнопки.

Кстати, если вы счастливый обладатель Мегафон и позвонили на номер тех. поддержки, то вас встречает голосовой бот - виртуальный помощник Елена. Елена говорит тем же голосом, что и наш бот, потому что тоже сделана на платформе Aimylogic. 

https://www.youtube.com/watch?v=qqHTk2QLyEQ

вот тут рассказывают про него, примерно с 52 минуты

А как предполагается интегрироваться в систему прав доступа в Directum?
Запрос в Directum приходит из Amylogic. Допустим пришел запрос на чтение каких-то данных. Как сценарий в Directum должен понять, что запрос можно выполнить, что ответ уйдет пользователю, который имеет права на просмотр в Direсtum?

Где-то должна таблица соответствия какая-то храниться между пользователем работающим с Алисой и пользователем Directum?
 

Авторизуйтесь, чтобы написать комментарий