#Голоса будущего: цифровые помощники

 

Виртуальность наступает. Цифровые помощники превращаются в незаменимых советчиков и любимых собеседников, способных принимать решения, выполнять задачи и занимать досуг. Вслед за интернациональными гигантами российские компании одна за одной разрабатывают собственных голосовых ассистентов. Ими давно обзавелись Яндекс, Тинькофф и Мегафон. Mail Group, Газпромбанк и Wildberries — в процессе, а дальновидные маркетологи уже начинают выстраивать продажи через искусственный интеллект. Скорость развития технологий поражает, и пока вы читаете эту статью информация безнадежно устаревает.

 

История:

1962 Создание IBM Shoebox — первой машины, распознающей речь, а точнее 16 слов и цифры от 0 до 9.

1970-е Решение Harpy, созданное учёными университета Карнеги – Меллон, распознающее 1011 слов

1993 Компания Apple выпустила Macintosh с технологией PlainTalk

1996 Появление Microsoft Clippit — первого помощника на базе машинного обучения, который получил широкое распространение

1997 Dragon представили технологию, позволяющую трансформировать в текст до 100 слов в минуту

2010 Apple покупает компанию Siri 

2011 Siri от Apple — первый современный интеллектуальный ассистент

2014 Первые интеллектуальные колонки Echo от Amazon

10 октября 2017 Первый запуск голосового ассистента Алиса от Яндекс

2019 Глобальное распространение виртуальных ассистентов. По данным исследования Voice Report, 72% жителей США, Великобритании и Канады хотя бы раз пользовались их помощью.

2021 Согласно прогнозам британской консалтинговой компании Ovum, число используемых цифровых помощников превысит общее население Земли.

 

Плюсы

– Поддерживают натуральный язык общения.
– Удобны для заказа товаров и услуг.
– Ориентируются на контекст. Помощник учитывает множество данных для улучшения качества работы, включая информацию, которую уже знает о вас.
– Поддаются обучению. Помощника всегда можно обучить дополнительным навыкам.

 

Минусы

– Распознавание речи все еще не идеально. Особенно это касается шумных помещений или ситуаций, когда говорят несколько людей одновременно.
– Общение с ассистентом отличается от человеческого. Перебить бота или дополнить слова жестами пока невозможно.
– Неработоспособность без интернета.
– Ограниченный набор функций. 

 

Что нас ждет в будущем?

– Проактивность — потенциальная способность ассистента обращаться к человеку самостоятельно.
– Эмоциональность. Изменение алгоритма работы с учетом различных эмоций собеседника.
– Развитие нейронных сетей и моделей.
– Визуализация. Возникновение визуального сопровождения при неудобстве использования голосового интерфейса.

 

SIRI

Сенсацией 2011 года стал iPhone 4s со встроенным голосовым помощником по имени Siri. Общение с ней превратилось в основное развлечение пользователей нового смартфона. На тот момент Siri могла взаимодействовать с 12 приложениями, среди которых были карты, напоминания, прогноз погоды, электронная почта и календарь. Очень быстро список навыков расширился, а Siri поселилась во всех устройствах Apple. Пока Siri не способна к эмоциональному интеллекту и ее возможности ограничены базовыми функциям устройства, в котором она обитает.

Голос первой версии Siri принадлежит актрисе по озвучиванию Сьюзан Беннетт. В интервью CNN, Беннетт рассказала, что после подписания контракта с компанией ScanSoft в 2005 году, она целый месяц по четыре часа в день наговаривала бессвязные фразы на диктофон.

Сегодня Siri подстраивается под каждого пользователя, знает его предпочтения и спустя несколько недель лучше понимает голос «хозяина».

Siri может позвонить и отправить сообщение любому из списка контактов, воспроизвести треки из медиатеки, рассказать о погоде, установить таймер или будильник. Кроме этого, Siri может управлять всеми устройствами умного дома с поддержкой HomeKit, в числе которых лампочки, розетки, вентиляторы, замки и многое другое. Специально для умного дома была выпущено умная колонка HomePod, где функция «Привет, Siri» работает в режиме «Всегда слушать».

HomePod

 

АЛИСА

В октябре 2017 года компания «Яндекс» официально представила собственного голосового ассистента, использующего технологии машинного обучения и системы искусственного интеллекта на базе нейронных сетей – «Алису».

Голос «Алисы» — синтетический, но у него есть живой прототип. Это актриса театра и кино Татьяна Шитова, озвучившая для российского кинопроката Натали Портман, Скарлетт Йоханссон, Эмму Стоун, Кэмерон Диас, Линдси Лохан и других.

Благодаря искусственному интеллекту и интеграции с онлайн-сервисами «Яндекса», «Алиса» умеет искать информацию в Интернете, давать ответы на вопросы, находить  нужные заведения, прокладывать удобный маршрут, сообщать прогноз погоды, рассказывать анекдоты, помогать в решении повседневных задач и даже играть в игры:  «Угадай песню», «Слова», «Верю — не верю», «Города», «Этот день в истории» и некоторые другие.

«Алиса» не ограничивается набором заранее заданных реплик — с ней можно общаться как с человеком, на естественном языке и на отвлечённые темы. «Алиса» распознает неполные фразы и вопросы, учитывает контекст сказанного и способна на импровизацию. Более того, она может шутить и демонстрирует собственный характер. В этом ей помогает нейронная сеть, обученная на огромном массиве текстов.

2 сентября 2019 года «Алиса» стала соведущей соревнований BLAST Pro Series. В ее обязанности входило знакомство участников с правилами проведения турнира, ответы на вопросы зрителей об особенностях игры CS:GO, а также поддержка игроков в тренировочных комнатах перед матчами.

В России «Алиса» — самый популярный помощник, живущий с недавнего времени  в умной колонке.

 

 

ОЛЕГ

«Олег» — виртуальный голосовой помощник в сфере финансов и лайфстайл-услуг, разработанный группой Тинькофф. «Олег» начал работать с июня 2019 в мобильном приложении онлайн банка. Общаться с ним можно с помощью голоса или мобильной клавиатуры. Для запуска достаточно сказать: «Привет, Олег» или «Слушай, Олег». Прервать общение можно фразами «Хватит» и «Позови человека».

Этот виртуальный помощник вежлив, настойчив, не любит панибратства и не учит пользователя жизни, пока тот не попросит. «Олег» говорит голосом актера Никиты Прозоровского.

Стартовые функции «Олега» заключались в переводе денег на счета в «Тинькофф» и Сбербанк, бронирование столиков в кафе и ресторанах, запись в салоны красоты, покупка билетов в кино, изменение данных пользователя в экосистеме «Тинькофф», заказ и отправка на почту электронных документов, например, справок для посольств. Кроме этого «Олег» может общаться на свободные темы, давать советы и консультации по банковским продуктам, анализировать тексты, определять настроение собеседника и подстраиваться под него.

Однажды «Олег» пытался пофлиртовать с «Алисой», но она его отшила.

 

Автор || Евгения Плохих, шеф-редактор
Фото || wikipedia.com, pixabay.com

ncvcQk7o3-s

 

 

 

 

 

*Эту статью можно прочитать в онлайн номере журнала ВЕСНА 2020

Поделиться: