Reuters в четверг опубликовало статью, раскрывающую некоторые из кропотливых работ, необходимых для того, чтобы Siri могла говорить на дополнительных языках, что остается одним из ее главных преимуществ перед конкурирующими виртуальными ассистентами.
Закулисный взгляд на эту работу появляется на фоне заявлений о том, что Apple растеряла свое лидерство в области голосовых помощников, поскольку Amazon, Google и Microsoft недавно расширили возможности своих соответствующих ассистентов.
Но для рынка смартфонов, где большая часть продаж приходится на страны за пределами США, большое преимущество Siri над другими ассистентами подчеркивается количеством языков, на которых она может говорить. Сообщается, что у Microsoft есть редакционная команда из 29 человек, которая занимается адаптацией Cortana для местных рынков, в то время как Google и Amazon заявляют, что планируют добавить больше языков в ближайшее время. Но это игра в догонялки: у Apple уже есть 21 язык, локализованный для 36 стран. Это выгодно отличается от Cortana от Microsoft (восемь), Google Assistant (четыре) и Alexa от Amazon (два).
В Apple компания начинает работать над новым языком, привлекая людей для чтения отрывков на различных акцентах и диалектах, которые затем транскрибируются вручную, чтобы компьютер имел точное представление произнесенного текста для обучения, сказал Алекс Асеро, глава группы по речи в Apple. Apple также записывает разнообразные звуки с использованием различных голосов. Отсюда создается языковая модель, которая пытается предсказывать последовательности слов.
Затем Apple развертывает «режим диктовки», свой переводчик текста в речь, на новом языке, сказал Асеро. Когда клиенты используют режим диктовки, Apple захватывает небольшой процент аудиозаписей и делает их анонимными. Записи, дополненные фоновым шумом и невнятными словами, транскрибируются людьми, что помогает снизить частоту ошибок распознавания речи вдвое.
Как только требуется объем данных будет собран и диктор озвучит ответы Siri на новом языке, Siri будет выпущена с ответами на то, что, по мнению Apple, будет наиболее распространенными вопросами. Затем Siri узнает больше о том, что спрашивают пользователи, с дополнительными корректировками, вносимыми через обновления каждые две недели.
Недостатком подхода Apple к написанию сценариев является то, что он не масштабируется, по словам Чарльза Джолли, создателя интеллектуального ассистента Oslo. «Вы не можете нанять достаточно авторов, чтобы создать систему, которая вам понадобится на каждом языке. Вам приходится синтезировать ответы», — сказал он Reuters. «Это займет годы».
Но именно над этим активно работают основатели Viv — первоначальные создатели Siri. «Viv была создана для решения проблемы масштабирования для интеллектуальных ассистентов», — сказал Даг Киттаус, генеральный директор и соучредитель Viv, которая была приобретена Samsung в прошлом году. «Единственный способ обогнать сегодняшние версии с ограниченной функциональностью — это открыть систему и позволить миру учить их».
Потребители вскоре смогут оценить, насколько далеко они продвинулись. Технология Viv будет использоваться в Bixby, новом виртуальном ассистенте Samsung, который появится в Galaxy S8, выпуск которого запланирован на конец этого месяца.