Сегодня Apple опубликовала новую запись в своем онлайн-журнале Machine Learning Journal, на этот раз посвященную собственной глубокой нейронной сети для обнаружения лиц, то есть технологии, которая используется для распознавания лиц в приложении «Фото» и других приложениях.
Функции обнаружения лиц впервые были представлены в iOS 10 в рамках фреймворка Core Image, и они использовались на устройстве для обнаружения лиц на фотографиях, чтобы пользователи могли просматривать свои изображения по людям в приложении «Фото».
По словам Apple, реализация этой технологии была непростой задачей, поскольку она требовала «на порядки больше памяти, гораздо больше дискового пространства и больше вычислительных ресурсов».
iCloud Фото из Apple — это облачное решение для хранения фотографий и видео. Однако из-за сильной приверженности Apple конфиденциальности пользователей мы не могли использовать серверы iCloud для вычислений компьютерного зрения. Каждая фотография и видео, отправленные в iCloud Фото, шифруются на устройстве перед отправкой в облачное хранилище и могут быть расшифрованы только устройствами, зарегистрированными в учетной записи iCloud. Следовательно, чтобы предоставить нашим клиентам решения для компьютерного зрения на основе глубокого обучения, нам пришлось напрямую решать проблемы запуска алгоритмов глубокого обучения на iPhone.
В записи журнала машинного обучения Apple описывается, как Apple преодолела эти трудности, задействовав графические и центральные процессоры в устройствах iOS, разработав оптимизации памяти для сетевых помех, загрузки и кэширования изображений, а также реализовав сеть таким образом, чтобы она не мешала другим задачам, ожидаемым от iPhone.
Новую запись стоит прочитать, если вас интересуют конкретные детали того, как Apple преодолела эти трудности для успешной реализации этой функции. Технические детали плотные, но понятные, и они дают интересное представление о том, как работает распознавание лиц.
С помощью своего журнала машинного обучения Apple стремится делиться сложными концепциями, лежащими в основе своих технологий, чтобы пользователи ее продуктов могли заглянуть за кулисы. Это также служит способом для инженеров Apple участвовать в сообществе ИИ.
Ранее Apple публиковала несколько статей о Siri, в том числе о том, как работает «Привет, Siri«, и статью об использовании машинного обучения и нейронных сетей для улучшения синтетических изображений.