Компания Anthropic сегодня анонсировала выпуск своей новейшей модели ИИ — Claude Opus 4.8. Anthropic утверждает, что модель стала «более эффективным помощником» благодаря улучшениям в агентном программировании, междисциплинарном мышлении, агентном использовании компьютера, интеллектуальной работе и агентном финансовом анализе.

Тестировщики отметили, что Opus 4.8 стала «более надежной и точной в своих суждениях» при выполнении агентных задач, а также продемонстрировала успехи в честности и достоверности ответов.
Первые тестировщики сообщают, что Opus 4.8 чаще указывает на неуверенность в своей работе и реже делает необоснованные заявления. Это подтверждается нашими оценками: вероятность того, что Opus 4.8 пропустит ошибки в написанном коде, примерно в четыре раза ниже, чем у предыдущей версии.
Оценки соответствия нормам показывают, что модель достигла новых высот в просоциальных характеристиках, таких как поддержка автономии пользователя и действия в интересах пользователя. Уровень нежелательного поведения, например введения в заблуждение, ниже, чем у Opus 4.7, и сопоставим с превью-версией Claude Mythos.
Бенчмарки Anthropic показывают, что Opus 4.8 набрала 69,2% в SWE-Bench Pro, обойдя GPT–5.5 и Gemini 3.1 Pro в этом и ряде других тестов, хотя GPT–5.5 по-прежнему лидирует в бенчмарке по программированию в терминале.
Быстрый режим Opus 4.8 работает в 2,5 раза быстрее, а стоимость использования модели теперь в три раза ниже, чем у предыдущих версий.
Наряду с Opus 4.8, Anthropic внедряет новые функции в свою линейку продуктов.
- Динамические рабочие процессы (исследовательская версия) — Claude теперь может выполнять более масштабные задачи в Claude Code. Модель способна планировать работу и запускать сотни параллельных субагентов в рамках одной сессии. Она может осуществлять миграцию кодовых баз объемом в сотни тысяч строк кода. Функция доступна для планов Claude Code Enterprise, Team и Max.
- Управление усилиями — В Claude.ai и Cowork пользователи могут выбирать, сколько усилий Claude должен приложить для ответа. При более низких настройках Claude будет отвечать быстрее и медленнее расходовать лимиты запросов. По умолчанию в Opus 4.8 установлен высокий уровень усилий, который, по мнению Anthropic, обеспечивает оптимальный баланс качества и пользовательского опыта.
- Messages API — Messages API теперь поддерживает системные записи внутри массива сообщений, что позволяет разработчикам обновлять инструкции для Claude прямо в процессе выполнения задачи.
Claude Opus 4.8 доступна везде с сегодняшнего дня. Цены на обычное использование не изменились по сравнению с Opus 4.7.
Anthropic работает над моделями, которые обладали бы такими же возможностями, как Opus 4.8, но при более низкой стоимости, а также над новым классом моделей, которые будут еще интеллектуальнее, чем Opus. В Anthropic сообщают, что разрабатывают средства защиты для модели Claude Mythos, которую сейчас тестирует небольшое количество организаций, и ожидают, что смогут предоставить доступ к моделям класса Mythos всем клиентам «в ближайшие недели».








































