Говорящие роботы в торговых залах заменяют реальных продавцов, «умные» колонки позволяют делать заказы в магазинах без помощи компьютера, а голосовая биометрия – подтверждать оплату одной фразой. Это не фантастика, а речевые технологии, которые все глубже проникают в розничную торговлю.
Первые разработки в сфере речевых технологий относятся еще к 18 веку. В 1779 году немецкий инженер Христиан Кратценштайн представил свое устройство для синтеза речи. Механический аппарат мог воспроизводить всего несколько гласных звуков, однако начало было положено. Фотографии и схемы устройства до сегодняшнего дня не сохранились.
В 1937 году американский ученый Гомер Дадли, сотрудник лаборатории Bell, создал первый электронный речевой синтезатор под названием Voder. Аппарат мог произносить лишь одно имя, но с разными интонациями. Интонация задавалась ассистентом при помощи клавиатуры.
В 1939 году советский физик Лев Мясников занялся созданием прибора для распознавания речи в рамках диссертации «Техническая фонетика» для Ленинградского университета. В 1942 году, во время блокады Ленинграда, он защитил свой проект и представил первую в мире систему, способную распознавать отдельные звуки человеческой речи.
В 1952 году голосовой распознаватель чисел от 1 до 9 представила лаборатория Bell, а спустя 10 лет IBM презентовала Shoebox. Помимо 16 заложенных слов и 6 цифр, система могла также различать 10 математических команд.
В 90-х появилось много новых систем распознавания речи, и каждая из них становилась все совершенней. Одной из первых программ, ориентированной на массовый рынок, стала Dragon Dictate. Она позволяла пользователю записывать текст, проговаривая его в микрофон. Система с легкость различала до 100 слов в минуту, а цена в 600 долларов позволила разработчикам вывести продукт на широкий рынок.
В 2001 году Microsoft решила интегрировать технологию распознавания речи в свой обновленный офисный пакет Office XP. Через год корпорация Google решила развивать голосовой поиск. Voice Search был не особо успешен, но стал отправной точкой для будущего интерактивного помощника Google Assistant.
Речевые технологии сегодня
С тех пор речевые технологии не только шагнули далеко вперед, но и прочно вошли в повседневную жизнь. С их помощью можно делать запросы в поисковых системах без использования клавиатуры, управлять домашними приборами, делать покупки в магазинах через голосовых помощников и оплачивать заказы, не вводя пароль.
Основными речевыми технологиями, использующимися в ритейле в настоящее время, являются:
- Запись звука и речи
Устройства, записывающие речевую информацию и звук – с телефонных линий, микрофонов или линейных выходов аппаратуры – могут выступать в качестве автономных регистраторов или цифровых диктофонов. Высокое качество звукозаписи, особенно у цифровых диктофонов, делает их пригодными для распознавания речи и голоса.
«Аудиозапись все чаще применяется торговыми компаниями, – говорит Наталья Тишкова, директор департамента обслуживания клиентов DPD в России. – Например, в бейдж консультанта устанавливают звукозаписывающее устройство, с которого впоследствии снимается речь, и происходит анализ информации. Оценивается соответствие скриптам, отношение к клиенту, выявляются слова-паразиты. Подобные методы используются для улучшения качества обслуживания».
- Распознавание речи
Используются как сравнительно простые технологии – например, распознавание отдельных команд для голосовой навигации по сайту, так и более сложные. К последним относится поиск ключевых слов и распознавание слитной речи.
В первом случае программа находит фрагменты, которые содержат заданные слова или словосочетания. Подобная технология применяется в поисковых системах. Распознавание слитной речи на большом словаре – наиболее сложная технология. Она трансформирует речь в текст, не ограничиваясь заданной грамматикой или лексикой.
- Синтез речи
Технология позволяет произносить текст голосом, приближенным к естественному. Чтобы синтезированная речь звучала натурально, специалисты решают задачи по воссозданию тембра голоса, плавности звучания, интонации, правильной расстановки пауз и ударений. Синтез речи применяется в различных областях, например, при производстве голосовых помощников и робототехники.
- Анализ и обработка речи
Сюда относится поиск ключевых слов в аудиозаписях, автоматический анализ и оценка телефонных переговоров, а также интеллектуальный анализ речевой информации, автоматически определяющий тематику разговора.
В основе лежат технологии распознавания слитной речи на большом словаре (LVCSR) и извлечения информации с помощью кластерного анализа данных (Data Mining Clustering). Речь преобразуется в текстовый файл, который можно использовать для автоматического лексико-семантического анализа.
- Голосовая биометрия
Данная технология позволяет подтверждать личность человека удаленно, например, по телефону, используя данные его голоса. Голос также уникален, как отпечаток пальцев или сетчатка глаза, поэтому надежность метода достигает 98%. Для этого анализируется более 70 параметров голоса.
Перечисленные технологии уже активно применяют зарубежные и российские ритейлеры. Одна из задач, которую решают крупные сетевые магазины с их помощью, – улучшение работы контакт-центров. Там активно внедряются системы голосового самообслуживания (IVR), речевой аналитики, систем управления качеством работы операторов и оценки удовлетворенности клиентов.
Речевые технологии помогают улучшить эффективность работы распределительных центров. С их помощью комплектовщики заказов могут в режиме реального времени поддерживать голосовую связь с системами управления складом, а также передавать информацию, не оформляя ее в бумажном или электронном виде.
В торговых залах устанавливают кассы самообслуживания с голосовым меню. Голосовые команды ускоряют и упрощают процесс покупки, а если терминал оборудован технологией распознавания лиц, то могут использоваться для того, чтобы сделать клиенту персонализированное предложение.
«Одна из востребованных сфер применения речевых технологий в розничной торговле – это чат-боты», – говорит Александр Ефимов, руководитель дирекции аналитических и индустриальных решений компании SAS Россия / СНГ. В электронной коммерции их используют как дополнительный канал взаимодействия с клиентами – они берут на себя первый контакт, выяснение потребности, консультацию, обработку запроса. К чат-ботам относятся и виртуальные голосовые помощники: Siri, Alexa, Алиса. Помимо прочего, они могут подобрать необходимый товар, сделать заказ в интернет-магазине, оформить доставку».
Розничная торговля в силу своих особенностей уже много лет является технологическим «первопроходцем» среди отраслей российской экономики, чему способствует очень высокая конкуренция, – считает Евгений Овчаров, заместитель директора департамента телекоммуникационных и инфраструктурных решений компании Oberon. При уменьшении покупательской способности клиентов спрос смещается из офлайн-канала в сторону продаж через менее затратные цифровые: веб-сайты, приложения, социальные сети и мессенджеры. Два ключевых критерия эффективности продажи в них – это удобство и безопасность покупки. Поэтому ритейлер обязан оставаться на связи по любому удобному пользователю каналу, текстовому или голосовому.
Кейсы
- Amazon
Впервые Amazon представил своего голосового помощника в Alexa 2014 году. Год спустя на рынке появился «умный» динамик Amazon Echo, куда был интегрирован голосовой помощник. Интеллектуальный динамик позволяет управлять различными устройствами в доме, а также делать заказы в онлайн-магазинах, ресторанах и кафе.
Покупателей привлекает простота использования. С помощью девайса можно быстро вызвать такси или заказать товар в интернете, занимаясь домашними делами. Поэтому продажи подобных устройств стремительно растут. По прогнозам аналитиков, скоро «умные» колонки из квартир перейдут в магазины и торговые центры.
«Продажа товаров и услуг через голосовых помощников – прекрасная возможность для ритейлеров одновременно расширить клиентский опыт и оптимизировать бизнес, – уверен Павел Лихницкий, генеральный директор компании DIS Group. – Но чтобы быть успешным в этой области, важно перейти от SEO к AEO – оптимизации под поисковые запросы голосом. Второй важный момент – наличие у ритейлера единой системы управления знаниями (СУЗ) для поддержания омниканальной коммуникации с клиентом. СУЗ гарантирует, что голосовой помощник использует ту же информацию, которая применяется для других каналов – чат-бота, сайта и так далее».
- «Магнит»
Сеть недавно внедрила технологию голосового управления Pick-by-Voice в своих распределительных центрах. Она позволила освободить руки и глаза операторов склада, поскольку ручные терминалы заменила гарнитура с наушниками и микрофоном, которая распознает речь. Теперь вместо текста на экране терминала сотрудник получает голосовые сообщения с пошаговыми указаниями по выполнению задачи: где взять товар, в каком количестве, куда отнести собранный заказ, и сам отвечает вслух.
Человек больше не отвлекается на чтение информации, у него свободны руки, а внимание полностью сконцентрировано на выполнении задания. К тому же, принимая информацию на слух, персонал лучше ориентируется в окружающей обстановке, что повышает безопасность работы на складе при большом количестве движущихся объектов вокруг. По итогам тестирования на пяти распределительных центрах производительность персонала выросла на 11%. Теперь «Магнит» планирует перевести на новую систему еще 38 центров до конца второго квартала 2020 года.
«Во время тестирования Pick-by-Voice мы зафиксировали улучшение основных показателей работы склада: сокращение сроков сборки заказов и расходов на складскую обработку грузов, уменьшение количества ошибок при отборе и увеличение пропускной способности склада», – прокомментировал Евгений Колесников, руководитель проекта департамента логистики «Магнита». После внедрения технологии на всех распределительных центрах компания ожидает значительного роста эффективности, особенно с учетом масштаба сети и сложности бизнес-процессов.
- «Теремок»
Год назад сеть ресторанов быстрого питания представила «Марусю» – антропоморфного робота, который способен принимать заказы, проводить оплату и поддерживать диалог с покупателями. Партнером «Теремка» стала российская компания «Альфа Роботикс». На изготовление робота потребовалось около полугода, а инвестиции в проект составили 1,1 млн рублей.
Как пояснили в компании, функция робота – не столько принимать заказы и заменять «живых» кассиров, сколько привлекать внимание посетителей. Благодаря технологиям распознавания и синтеза речи Маруся может отвечать на вопросы клиентов. Для распознавания голоса «Маруся» использует технологии Google. Система искусственного интеллекта, позволяющая роботу общаться с покупателем, является собственной разработкой «Альфа-роботикс».
Это не единственный пример использования российскими ритейлерами роботов с поддержкой речевого общения. Сеть «Лента» уже использует в своих магазинах разработку пермской компании Promobot. Сервисный робот работает в некоторых магазинах «Ленты», рассказывая покупателям об акциях и скидках. Они свободно передвигается по залу и узнает постоянных клиентов благодаря функции распознавания лиц.
- DPD
C 2017 года в колл-центре компании DPD трудится робот Юля. Решение на базе искусственного интеллекта выполняет функции специалиста контактного центра. В основе разработки технология – синтеза устной речи Text-To-Speech (TTS).
Изначально Юля совершала исходящие звонки, информируя получателей о статусе доставки. После ее обязанности были расширены, и теперь голосовой бот отвечает также на входящие вызовы, а с января 2019 года – на письма клиентов. Сейчас порядка 50% входящих и исходящих звонков в компании обрабатываются без участия сотрудников.
«Благодаря Юле мы смогли повысить доступность и эффективность работы контактного центра без увеличения штата специалистов», – комментирует Наталия Тишкова, DPD.
- Tele2
Всё большую популярность приобретают системы интеллектуального голосового анализа. Speech recognition помогает контролировать персонал, выполнение скриптов, взаимодействие с покупателем, качество клиентского сервиса, в том числе, в реальном времени.
«Недавно Tele2 открыл новый формат точек продаж, – рассказывает Дмитрий Смирнов, директор по развитию бизнеса ИТ-компании КРОК в ритейле. – С помощью речевой аналитики в офлайне оператор добился самого высокого показателя уровня удовлетворенности клиентов среди телеком-операторов. Использование технологии также положительно повлияло на рост объема продаж, увеличив его на 5%».
Перспективы
Как будут развиваться речевые технологии в ближайшем будущем? Мы собрали мнения экспертов.
Многие ритейлеры развивают интернет-магазины, и вопрос автоматизации обслуживания становится ключевым, – уверен Андрей Лысков, заместитель генерального директора «Центра речевых технологий». Взаимодействие с оператором, согласование заказа, способа доставки – все это можно делать с голосовым помощником, используя современные системы синтеза голоса и распознавания.
Наиболее перспективным он считает использование речевых технологий не только в телефонных и текстовых форматах, но и в залах обслуживания на средних микрофонах – когда используются не гарнитуры, а устройства, находящиеся на более длинном расстоянии: цифровые бейджи или устройства в зонах обслуживания.
«Фактически мы говорим про автоматизацию функции «тайных покупателей», – поясняет Андрей Лысков. Существует ряд показателей, которые позволяют вводить объективные KPI продавца: насколько он точно и качественно выполняет рекомендации, учитывает скрипты, работает с допродажами. Можно выявлять лучшие практики на основе его слов, негативного или позитивного отклика у клиента. Используя полученные данные, можно не только контролировать работу, но и улучшать скрипты, обучать сотрудников и так далее».
Массово интегрироваться продолжат голосовые интерфейсы, – полагает Александр Ефимов, SAS: «По прогнозам, к 2021 году чат-бот, понимающий и синтезирующий речь, станет совершенно обыденной и привычной функцией для подавляющего большинства интернет-сервисов в России. Продвинутая аналитика позволит выстраивать детальный профиль каждого клиента на основе анализа текстового наполнения сайтов, которые он посещал, что поможет значительно улучшить понимание потребительских запросов и интересов».
По мнению эксперта, будет широко использоваться анализ отзывов в интернете. Он позволит производителям не только мониторить конкурентов, но и оперативно выявлять и устранять дефекты в продуктах до того, как поступит первый гарантийный талон. Выявления важных закономерностей в текстовых отзывах, жалобах и обращениях благоприятно скажется на клиентском опыте, на удовлетворенности потребителя продуктом и, как следствие, на его лояльности бренду.
Евгений Овчаров, Oberon, уверен, что в ближайшие годы у ритейлеров вырастет интерес к глубокой речевой аналитике:«За счет сквозного анализа речи она позволяет на реальных оцифрованных данных проверять новые бизнес-гипотезы, оценивать RIO, – уточняет эксперт. С этой технологией под контролем находятся уже не 1-3% звонков клиентов в контакт-центр, а 100%, фиксируется не только текст, но и изменение тональности беседы. Решение информирует о паузах и негативе, определяет ключевые для бизнеса слова и «триггеры» потенциальных проблем до поступления жалобы. Уменьшаются и длительность звонков, и число повторных вызовов. Технология дает «счетное подтверждение» для вводимых изменений и демонстрирует их результаты».
По его мнению, глубокая речевая аналитика и цифровизация речевых каналов сокращают издержки ритейлеров за счет снижения стоимости владения колл-центром, помогают при лавинообразном росте количества обращений (например, во время распродаж) и повышают удовлетворенность потребителей.
Павел Лихницкий, DIS Group, убежден, что в ближайшее время мы увидим активное развитие голосовых помощников. У них появятся функции распознавания интонаций, они будут точнее отвечать на вопросы собеседника и идентифицировать его по голосу. Также востребованной станет голосовая биометрия в ритейле – она может использоваться для подтверждения оплаты покупок.
«Сейчас оплата с помощью биометрических данных в российском ритейле развивается в сторону использования отпечатков пальцев и изображения лица. Область голосовой биометрии пока у нас активно осваивают банки, – говорит Павел Лихницкий. – Также голосовая биометрия может помочь идентифицировать покупателей для того, чтобы делать им персонализированное предложение».
К числу наиболее перспективных технологий относит нейронные сети Наталья Тишкова, DPD: «Они позволят не просто отвечать заскриптованно, но и распознавать тематику разговора. Дополнительная ценность нейросетей заключается в их непрерывном самообучении: чем больше они участвуют в общении, тем шире становятся их коммуникационные возможности».
Сергей Шлыков, CEO компании Chatme.ai, считает, что у ритейлеров вырастет интерес к использованию чат-ботов, а сами голосовые роботы станут «умнее»: «Например, клиент пишет: «Ищу черные прямые джинсы, не укороченные». Умный чат-бот сразу определит не только тип товара, но и цвет, фасон, а также учтет отрицание. Обучить чат-бота на распознавание подобных высказываний можно с помощью представленной Google в конце 2018 года языковой модели BERT (Bidirectional Encoder Representations from Transformers). Этот алгоритм смотрит на контекст, расположение слов в предложении и учитывает их с помощью механизмов внимания».
Наиболее перспективными речевыми технологиями станут те, которые работают на основе искусственного интеллекта – уверен Дмитрий Смирнов, КРОК. К ним относятся технологии интеллектуального голосового анализа, технологии интеллектуального семантического поиска, а также технологии распознавания тембра голоса с целью аутентификации пользователя. Также широкое распространение в ходе автоматизации клиентского сервиса классической розницы и онлайн-торговли получат многофункциональные голосовые помощники – они смогут заменить операторов центров обработки вызовов.
Однако Арсений Кондратьев, руководитель Liquid Studio Accenture, считает, что из-за специфики формата обслуживания в ритейле не так просто заменить сотрудника роботом, подчиняя его поведение линейным алгоритмам. Поэтому при применении речевых технологий как в онлайн, так и в офлайн-магазинах становится важно использование инструментов машинного обучения – они могут повысить качество диалога с клиентом.
«Это общий вектор развития речевых технологий, – отмечает эксперт. – Если говорить о конкретных инструментах, то это платформы обработки естественного языка (NLP). Также возможно совмещать речевые технологии, например, с виртуальной или дополненной реальностью».
Алёна Яркова | RETAILER.ru
Подписывайтесь на наш канал в Telegram, чтобы первым быть в курсе главных новостей ритейла.