Сегодня Google объявила о нескольких новых функциях искусственного интеллекта, которые интегрируются в операционную систему Android 15, что дает нам представление о том, с чем будет конкурировать операционная система iPhone от Apple позже в этом году.
По словам Google, Android был разработан с учетом того, что искусственный интеллект лежит в его основе, а Gemini является фундаментальной частью пользовательского опыта Android, работающей на системном уровне. Существует поисковая строка на базе ИИ, которую можно использовать для ответов на запросы и поиска информации, а функция Circle to Search с сегодняшнего дня может использоваться для решения математических и физических задач или получения помощи с домашними заданиями.
Gemini выступает в качестве ИИ-ассистента на Android вместо Google Assistant, и Gemini AI сможет вызываться как оверлей поверх любого используемого приложения. Gemini контекстно-ориентирован и может предугадывать действия пользователя смартфона и предоставлять контекст в реальном времени. Он может создавать изображения для текстов и социальных сетей или отвечать на вопросы о просматриваемом видео. Он может обрабатывать PDF-файлы, веб-сайты и другой контент, предоставляя сводки и выполняя перевод.
Google использует ИИ на устройстве для некоторых функций, чтобы обеспечить конфиденциальность чувствительных данных, и это также план Apple. Множество слухов предполагают, что многие первые функции ИИ от Apple будут работать на устройстве, а не через облачный сервер.
Gemini Nano, ИИ Google для устройств, в настоящее время выполняет такие задачи, как генерация умных ответов в приложениях для обмена сообщениями и суммирование голосовых заметок. Gemini Nano с мультимодальностью появится на телефонах Pixel позже в этом году, что позволит реализовать новые функции ИИ на устройстве, такие как TalkBack, который может помочь слепым и слабовидящим пользователям лучше ориентироваться в окружающем мире. Google также разрабатывает функцию проверки вызовов, которая активно прослушивает звонки и сообщает пользователям, похоже ли это на мошенничество.
Сегодня Google также представила Gemini 1.5 Flash, облегченную версию своей модели Gemini Pro AI. Gemini Flash более эффективен, менее дорог и имеет меньшую задержку, что делает его идеальным для крупномасштабных развертываний. Google утверждает, что Gemini 1.5 Flash способен обеспечивать «впечатляющее качество» при своих размерах, преуспевая в суммировании, чат-приложениях, создании подписей к изображениям и видео, а также в извлечении данных из длинных документов.
Gemini 1.5 Pro также был улучшен, и он способен следовать все более сложным и нюансированным инструкциям, включая обработку документов объемом до 1500 страниц или часового видеоконтента. С Gemini можно взаимодействовать в Google Messages, а подписчики Gemini Advanced получат доступ к новому мобильному диалоговому интерфейсу, который делает общение с Gemini более интуитивным. Индивидуальные версии Gemini, называемые Gems, также доступны подписчикам для персонализированных помощников, которые могут помочь с тренировками, предоставлять рецепты и многое другое, обладая определенными личностями.
Project Astra, еще один проект Google, фокусируется на ИИ-агентах, которые могут быть полезны в повседневной жизни. Google продемонстрировала прототипы агентов, способных идентифицировать объекты, предоставлять контекст информации с камеры и запоминать хронологию событий для поиска потерянного предмета.
Google планирует предоставить больше информации о новых функциях Android 15 позднее на этой неделе.