MacRumors

Skip to Content

Grok AI получает функции зрения и голоса в приложении для iOS

xAI запустила новый голосовой режим для своего чат-бота Grok, представив функцию Grok Vision, которая позволяет пользователям взаимодействовать с миром через камеру своего смартфона. Как и ChatGPT и Google Gemini, Grok теперь может интерпретировать то, что видит ваш телефон, и отвечать в режиме реального времени.

grok ai logo
Используя Grok Vision, пользователи iPhone могут навести камеру на объект и спросить: «Что это такое?» – и чат-бот вслух ответит с учетом контекста. Эта функция теперь доступна в приложении Grok для iOS, но пользователям Android придется подождать доступа к ней немного дольше.

В дополнение к визуальному распознаванию, голосовой режим теперь поддерживает многоязычное аудио, позволяя пользователям общаться с Grok на нескольких языках. Также интегрирован поиск в реальном времени, что дает чат-боту возможность предоставлять мгновенные ответы, отражающие самую свежую информацию.

Улучшения следуют за внедрением на прошлой неделе новой функции памяти Grok, которая позволяет чат-боту вспоминать прошлые взаимодействия – включая пользовательские предпочтения и ранее заданные вопросы – для предоставления более персонализированных ответов и предложений.

xAI также недавно выпустила первую версию Studio, предоставляющую рабочее пространство для создания документов и кода, аналогичное Canvas в ChatGPT. Studio открывается в отдельном окне и предназначена для обеспечения более сфокусированной среды для создания контента.

Grok доступен для бесплатной загрузки в App Store. [Прямая ссылка]