Claude стал «меньше думать» и чаще ошибаться по данным анализа логов

2 мин
Claude стал «меньше думать» и чаще ошибаться по данным анализа логов

Анализ 6 852 сессий Claude Code, проведённый AI-директором из AMD, показал заметные изменения в поведении модели Anthropic за период январь–март.

Основной вывод — снижение глубины рассуждений. Медианная длина reasoning-цепочек упала около с 2200 до 600 символов, что указывает на сокращение «бюджета мышления» модели.

Параллельно наблюдается резкий увеличение числа программный интерфейс-вызовов — почти в 80 раз с февраля по март. Это означает, что схема стала чаще компенсировать недостаток рассуждений повторными запросами и итерациями вместо одного глубокого ответа.

Равным образом изменилось поведение при решении задач. Claude стал чаще «сдаваться», запрашивать продолжение или уточнение, а число таких случаев зафиксировано на уровне 173 за короткий период, тогда как ранее они практически не встречались.

Отдельно отмечается снижение метрики reads-per-edit — с 6.6 до 2.0. Это означает, что модель стала реже изучать исходник или файлы перед внесением изменений, что напрямую влияет на качество работы в программировании.

Равным образом выросло число противоречий в ответах: схема чаще меняет позицию в ходе рассуждения, что снижает стабильность решений.

Занимательный фактор — зависимость от времени суток. Худшие результаты фиксируются в вечерние часы по PST, что может указывать на влияние загрузки инфраструктуры на качество работы модели.

В совокупности это создаёт картину не «сломавшейся» модели, а скорее перегруженной системы, где качество поведения зависит от ресурсов и условий инференса.

По данным автора, Anthropic частично подтвердила наличие подобных эффектов, что делает наблюдение одним из наиболее детальных публичных аудитов поведения LLM в реальных условиях.

Читают сейчас

Яндекс ко Дню космонавтики открыл в интернете инициатива под названием научно-ироничный центр экспериментальных запусков

21 минуту назад

Яндекс ко Дню космонавтики открыл в интернете инициатива под названием научно-ироничный центр экспериментальных запусков

Яндекс ко Дню космонавтики открыл доступ к онлайн-проекту научно-ироничного центра экспериментальных запусков. В рамках этого учебного решения на орбиту Земли предлагается отправить вообще всё, что пр

Artemis II завершила 10-дневный полёт и успешно вернулась на Землю

1 час назад

Artemis II завершила 10-дневный полёт и успешно вернулась на Землю

Миссия Artemis II завершилась полной посадкой экипажа после 10-дневного полёта вокруг Луны и обратно. По данным NASA, корабль Orion вошёл в атмосферу Земли на скорости около 24–25 тысяч миль в час и у

Почему Claude Code «отупел» после февраля? Доклад на 6852 сессиях

1 час назад

Почему Claude Code «отупел» после февраля? Доклад на 6852 сессиях

Директор группы AI в AMD Стелла Лауренцо опубликовала на GitHub разбор работы Claude Code за три месяца — с января по март 2026 года. В основе — 6852 сессии, 234 760 вызовов инструментов и почти 18 ты

На Госуслугах открылся набор в космонавты — подать свою заявку можно до 30 июня 2026 года

1 час назад

На Госуслугах открылся набор в космонавты — подать свою заявку можно до 30 июня 2026 года

На портале Госуслуги открылся набор в космонавты — подать свою заявку можно до 30 июня 2026 года. Требования к участию строгие, но реалистичные: заявителю должно быть меньше 35 лет, увеличение от 150

YouTube повысил цены на подписки YouTube Premium и YouTube Music Premium в США

1 час назад

YouTube повысил цены на подписки YouTube Premium и YouTube Music Premium в США

Видеохостинг YouTube подтвердил подорожание подписок YouTube Premium и YouTube Music Premium для пользователей в США. Ознакомиться далее