MacRumors

Skip to Content

Anthropic запускает Claude Opus 4.8 с улучшениями в программировании и точности ответов

Компания Anthropic сегодня анонсировала выпуск своей новейшей модели ИИ — Claude Opus 4.8. Anthropic утверждает, что модель стала «более эффективным помощником» благодаря улучшениям в агентном программировании, междисциплинарном мышлении, агентном использовании компьютера, интеллектуальной работе и агентном финансовом анализе.

anthopic claude
Тестировщики отметили, что Opus 4.8 стала «более надежной и точной в своих суждениях» при выполнении агентных задач, а также продемонстрировала успехи в честности и достоверности ответов.

Первые тестировщики сообщают, что Opus 4.8 чаще указывает на неуверенность в своей работе и реже делает необоснованные заявления. Это подтверждается нашими оценками: вероятность того, что Opus 4.8 пропустит ошибки в написанном коде, примерно в четыре раза ниже, чем у предыдущей версии.

Оценки соответствия нормам показывают, что модель достигла новых высот в просоциальных характеристиках, таких как поддержка автономии пользователя и действия в интересах пользователя. Уровень нежелательного поведения, например введения в заблуждение, ниже, чем у Opus 4.7, и сопоставим с превью-версией Claude Mythos.

Бенчмарки Anthropic показывают, что Opus 4.8 набрала 69,2% в SWE-Bench Pro, обойдя GPT–5.5 и Gemini 3.1 Pro в этом и ряде других тестов, хотя GPT–5.5 по-прежнему лидирует в бенчмарке по программированию в терминале.

Быстрый режим Opus 4.8 работает в 2,5 раза быстрее, а стоимость использования модели теперь в три раза ниже, чем у предыдущих версий.

Наряду с Opus 4.8, Anthropic внедряет новые функции в свою линейку продуктов.

  • Динамические рабочие процессы (исследовательская версия) — Claude теперь может выполнять более масштабные задачи в Claude Code. Модель способна планировать работу и запускать сотни параллельных субагентов в рамках одной сессии. Она может осуществлять миграцию кодовых баз объемом в сотни тысяч строк кода. Функция доступна для планов Claude Code Enterprise, Team и Max.
  • Управление усилиями — В Claude.ai и Cowork пользователи могут выбирать, сколько усилий Claude должен приложить для ответа. При более низких настройках Claude будет отвечать быстрее и медленнее расходовать лимиты запросов. По умолчанию в Opus 4.8 установлен высокий уровень усилий, который, по мнению Anthropic, обеспечивает оптимальный баланс качества и пользовательского опыта.
  • Messages API — Messages API теперь поддерживает системные записи внутри массива сообщений, что позволяет разработчикам обновлять инструкции для Claude прямо в процессе выполнения задачи.

Claude Opus 4.8 доступна везде с сегодняшнего дня. Цены на обычное использование не изменились по сравнению с Opus 4.7.

Anthropic работает над моделями, которые обладали бы такими же возможностями, как Opus 4.8, но при более низкой стоимости, а также над новым классом моделей, которые будут еще интеллектуальнее, чем Opus. В Anthropic сообщают, что разрабатывают средства защиты для модели Claude Mythos, которую сейчас тестирует небольшое количество организаций, и ожидают, что смогут предоставить доступ к моделям класса Mythos всем клиентам «в ближайшие недели».