xAI запустила новый голосовой режим для своего чат-бота Grok, представив функцию Grok Vision, которая позволяет пользователям взаимодействовать с миром через камеру своего смартфона. Как и ChatGPT и Google Gemini, Grok теперь может интерпретировать то, что видит ваш телефон, и отвечать в режиме реального времени.
Используя Grok Vision, пользователи iPhone могут навести камеру на объект и спросить: «Что это такое?» – и чат-бот вслух ответит с учетом контекста. Эта функция теперь доступна в приложении Grok для iOS, но пользователям Android придется подождать доступа к ней немного дольше.
В дополнение к визуальному распознаванию, голосовой режим теперь поддерживает многоязычное аудио, позволяя пользователям общаться с Grok на нескольких языках. Также интегрирован поиск в реальном времени, что дает чат-боту возможность предоставлять мгновенные ответы, отражающие самую свежую информацию.
Улучшения следуют за внедрением на прошлой неделе новой функции памяти Grok, которая позволяет чат-боту вспоминать прошлые взаимодействия – включая пользовательские предпочтения и ранее заданные вопросы – для предоставления более персонализированных ответов и предложений.
Представляем Grok Vision, многоязычное аудио и поиск в реальном времени в голосовом режиме. Доступно сейчас.
Grok habla español
Grok parle français
Grok Türkçe konuşuyor
グロクは日本語を話す
ग्रोक हिंदी बोलता है pic.twitter.com/lcaSyty2n5
— Ebby Amir (@ebbyamir) April 22, 2025
xAI также недавно выпустила первую версию Studio, предоставляющую рабочее пространство для создания документов и кода, аналогичное Canvas в ChatGPT. Studio открывается в отдельном окне и предназначена для обеспечения более сфокусированной среды для создания контента.
Grok доступен для бесплатной загрузки в App Store. [Прямая ссылка]