У Amazon есть тысячи сотрудников по всему миру, которые прослушивают голосовые записи, сделанные в домах владельцев Amazon Echo, сообщает Bloomberg.
Голосовые записи фиксируются при произнесении ключевого слова Alexa, а затем подмножество этих записей прослушивается, транскрибируется, аннотируется и добавляется обратно в программное обеспечение в рамках усилий Amazon по улучшению распознавания голосовых команд Alexa. У Amazon есть центры улучшения Alexa в таких местах, как Бостон, Коста-Рика, Индия и Румыния.
Семь человек, знакомых с процессом проверки Amazon, рассказали Bloomberg и раскрыли некоторые инсайдерские детали программы, которые могут вызывать беспокойство у пользователей Echo.
Хотя большая часть работы описывается как «рутинная», сотрудники иногда сталкивались с более личными записями, например, с пением женщины невпопад в душе или с криками ребенка о помощи. У сотрудников Amazon есть внутренние чаты, где они делятся файлами, когда требуется помощь в разборе слова или, что более тревожно, когда находится «забавная запись».
Двое работников рассказали Bloomberg, что слышали тревожные или потенциально преступные записи, и хотя Amazon утверждает, что для таких случаев существуют процедуры, некоторым сотрудникам говорили, что компания не обязана вмешиваться.
Иногда они слышат записи, которые находят тревожными или потенциально преступными. Двое работников сказали, что они услышали то, что, по их мнению, было сексуальным насилием. Когда такое случается, они могут поделиться этим опытом во внутреннем чате, чтобы снять стресс. Amazon заявляет, что имеет процедуры для работников на случай обнаружения чего-то тревожного, но двое сотрудников из Румынии сказали, что после запроса руководства по таким случаям им ответили, что это не дело Amazon вмешиваться.
Пользователи Alexa имеют возможность отключить использование своих голосовых записей для улучшения сервиса, но некоторые могут не знать о существовании этих опций. Amazon также не дает ясно понять, что записи прослушиваются реальными людьми.
По данным Bloomberg, записи, отправляемые сотрудникам, работающим над Alexa, не содержат полного имени или адреса пользователя, но с записью связаны номер учетной записи, имя и серийный номер устройства.
В заявлении для Bloomberg Amazon сообщила, что «чрезвычайно малая» часть голосовых записей Alexa аннотируется, и существуют меры для защиты личности пользователя.
Мы серьезно относимся к безопасности и конфиденциальности личной информации наших клиентов. Мы аннотируем лишь чрезвычайно малую выборку голосовых записей Alexa, чтобы [улучшить] качество обслуживания клиентов. Например, эта информация помогает нам обучать наши системы распознавания речи и понимания естественного языка, чтобы Alexa лучше понимала ваши запросы и обеспечивала бесперебойную работу сервиса для всех.
У нас есть строгие технические и операционные меры безопасности, а также политика абсолютной нетерпимости к злоупотреблению нашей системой. Сотрудники не имеют прямого доступа к информации, которая может идентифицировать личность или учетную запись, в рамках этого рабочего процесса. Вся информация обрабатывается с высокой степенью конфиденциальности, и мы используем многофакторную аутентификацию для ограничения доступа, шифрование сервисов и аудит нашей системы контроля для ее защиты.
Стандартная практика — использовать некоторые записи для улучшения продукта. У Apple есть сотрудники, которые прослушивают запросы Siri, чтобы убедиться, что интерпретация запроса совпадает с тем, что сказал человек. Однако записи очищаются от идентифицирующей информации и хранятся шесть месяцев со случайным идентификатором.
Google также имеет сотрудников, которые имеют доступ к аудиофрагментам Google Assistant с целью улучшения продукта, но Google, как и Apple, удаляет лично идентифицирующую информацию, а также искажает аудио.
Amazon, похоже, не удаляет всю лично идентифицирующую информацию, и хотя Echo предназначен для сбора аудио только при произнесении ключевого слова, сотрудники, которые говорили с Bloomberg, утверждали, что часто слышат аудиофайлы, которые, по-видимому, начали запись без какого-либо ключевого слова.
Пользователям Alexa, обеспокоенным данными, собираемыми и используемыми Amazon, следует убедиться, что они включили все функции конфиденциальности и сняли флажок с опции разрешения Amazon сохранять записи Echo. Дополнительные сведения о том, как Amazon использует собранные голосовые записи, можно найти в оригинальной статье Bloomberg.
Обновление: Amazon предоставила следующее заявление для MacRumors в качестве разъяснения: «По умолчанию устройства Echo разработаны для обнаружения только выбранного вами ключевого слова (Alexa, Amazon, Computer или Echo). Устройство обнаруживает ключевое слово, идентифицируя акустические шаблоны, соответствующие ключевому слову. Аудио не сохраняется и не отправляется в облако, если устройство не обнаруживает ключевое слово (или Alexa не активируется нажатием кнопки).»