Anthropic назвала причины «отупения» Claude Code

2 мин
Anthropic назвала причины «отупения» Claude Code

Anthropic объяснила, почему части пользователей Claude Code в последние недели казалось, что инструмент стал хуже писать и править код. В инженерном разборе компания пишет, что дело было не в самой модели, а в продуктовой обвязке вокруг нее: настройке глубины рассуждения (reasoning effort), работе с контекстом и системной инструкции. По версии Anthropic, изменения затронули Claude Code, Claude Agent SDK и Claude Cowork, но не программный оболочку и не инфраструктуру инференса.

4 марта Anthropic переключила настройку рассуждения по умолчанию в Claude Code с high на medium, чтобы снизить задержки, расход токенов и число ситуаций, когда казалось, что интерфейс завис. Вскоре пользователи стартовали жаловаться, что Claude Code стал менее сообразительным. 7 апреля компания откатила подход: теперь Opus 4.7 по умолчанию работает на xhigh, а остальные модели — на high.

Вторая причина связана с очисткой старых блоков "мышления" после простоя сессии больше часа. Anthropic хотела убирать лишние рассуждения один раз, чтобы снижать задержку и расход токенов при возвращении к работе. Но из-за бага очистка запускалась снова на каждом следующем шаге. В результате Claude мог терять понимание того, почему раньше выбрал те или иные правки и вызовы инструментов: он забывал контекст, повторялся и хуже выбирал следующие действия.

Третья причина — инструкция отвечать короче. Anthropic пыталась уменьшить многословие Claude Code и добавила правило: между вызовами инструментов писать не длиннее 25 слов, а финальный ответ держать в пределах 100 слов, если проблема не требует большего. Вместе с другими изменениями промпта это ударило по качеству работы с кодом: на одной из расширенных внутренних проверок организация увидела снижение на 3 процентов для Opus 4.6 и Opus 4.7. Инструкцию откатили 20 апреля; все три проблемы, по версии Anthropic, закрыты к версии v2.1.116.

Этот случай хорошо демонстрирует хрупкость агентных ИИ-инструментов. Для пользователя все выглядит просто: "Claude стал хуже". Но на практике качество такого продукта зависит не только от весов модели, а от множества внешних решений — уровня рассуждения, кеша, управления контекстом, системных инструкций и интерфейсных компромиссов. Даже сильная модель в такой обвязке может начать вести себя как сломанный инструмент.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Глава Microsoft объяснил, почему ИИ не обесценит людей

4 часа назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

6 часов назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

7 часов назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

8 часов назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

10 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения