Когда Apple представила iOS 10, macOS Sierra, watchOS 3 и tvOS 10 на Всемирной конференции разработчиков 2016 года, компания также объявила о планах внедрить новую технологию под названием «Дифференциальное сокрытие данных» (Differential Privacy), которая помогает компании собирать данные и паттерны использования от большого числа пользователей без ущерба для индивидуальной безопасности.
На тот момент Apple заявила, что дифференциальное сокрытие данных будет использоваться в iOS 10 для сбора данных с целью улучшения подсказок QuickType и эмодзи, предложений глубоких ссылок Spotlight и подсказок при поиске в Заметках, а также в macOS Sierra для улучшения предложений автокоррекции и подсказок при поиске.
Вокруг дифференциального сокрытия данных и его значения для конечных пользователей возникло много путаницы, что побудило Recode написать статью, проясняющую многие детали этого подхода.
Прежде всего, как и в случае со всем сбором данных Apple, существует возможность отказаться от обмена данными с компанией. Сбор дифференциальных данных является полностью добровольным, и пользователи могут решать, отправлять ли данные в Apple.
Apple начнет сбор данных начиная с iOS 10 и не делала этого ранее, а также не будет использовать хранящиеся в облаке фотографии пользователей iOS для улучшения возможностей распознавания изображений в приложении «Фото».
Что касается собираемых данных, Apple заявляет, что изначально дифференциальное сокрытие данных будет ограничено четырьмя конкретными сценариями использования: новые слова, которые пользователи добавляют в свои локальные словари; эмодзи, набранные пользователем (чтобы Apple могла предлагать замены эмодзи); глубокие ссылки, используемые внутри приложений (при условии, что они помечены для публичного индексирования); и подсказки при поиске в заметках.
Apple также продолжит выполнять большую часть своей предиктивной работы на самом устройстве, что было начато с проактивных функций в iOS 9. Эта работа не задействует облако для анализа, и данные также не передаются с использованием дифференциального сокрытия данных.
Глубокая забота Apple о конфиденциальности пользователей ставит ее сервисы, такие как Siri, позади конкурирующих сервисов других компаний, но дифференциальное сокрытие данных дает компании возможность собирать полезные данные без ущерба для безопасности своей клиентской базы.
Как пояснил вице-президент Apple по разработке программного обеспечения Крейг Федериги на главной презентации WWDC, дифференциальное сокрытие данных использует хеширование, субдискретизацию и введение шума для обеспечения обучения на основе данных большого числа пользователей без одновременного сбора данных об отдельных людях.