Вышел Claude Opus 4.7 — втрое лучше видит, строже слушает инструкции

3 мин
Вышел Claude Opus 4.7 — втрое лучше видит, строже слушает инструкции

Anthropic выпустила Claude Opus 4.7 — новую флагманскую схема общего доступа, которая заметно подтянулась в программировании, зрении и следовании инструкциям. Цена осталась прежней: $5 за миллион входных токенов и $25 за миллион выходных. В программный оболочку модель доступна под строкой claude-opus-4-7, а также через Amazon Bedrock, Google Vertex AI и Microsoft Foundry. Anthropic отдельно предупреждает, что расход токенов на тех же задачах может вырасти.

Главный технический скачок — зрение. Opus 4.7 принимает изображения до 2576 пикселей по длинной стороне (приблизительно 3,75 мегапикселя) — это более чем в три раза больше, чем у прежних Claude-моделей. На визуальном бенчмарке компании XBOW, которая делает автономные пентесты, модель показала 98,5% против 54,5% у Opus 4.6. Лучше видит — лучше работает с плотными скриншотами для computer-use агентов, схемами, диаграммами и документами. Следование инструкциям тоже стало строже: Anthropic прямо предупреждает: промпты под старые модели могут начать работать иначе — Opus 4.7 понимает формулировки буквально там, где предшественники пропускали части задания.

В кодинге улучшения подтверждают внешние тестировщики. У GitHub — плюс 13% на внутреннем бенчмарке из 93 задач, в том числе четыре, которые не решали ни Opus 4.6, ни Sonnet 4.6. У Cursor — 70% на CursorBench против 58 процентов у Opus 4.6. Notion отчитался о росте в 14% при меньшем расходе токенов и тройном сокращении ошибок в вызовах инструментов. Rakuten на своем внутреннем SWE-Bench закрыл в три раза больше production-задач. Vercel отметил новое поведение, которого не было у прошлых Claude: схема строит доказательства корректности перед тем, как взяться за системный исходник.

Наряду с моделью Anthropic запустила три вещи на стороне продукта. В api появился новый уровень усилий xhigh— между high и max, а также публичная бета task budgets для управления расходом токенов на длинных прогонах. В Claude Code дефолтный уровень усилий подняли до xhigh для всех тарифов, добавили команду /ultrareview для отдельной сессии ревью кода (Pro и Max дают три бесплатных использования) и расширили auto mode на Max-подписчиков.

Отдельный сюжет — позиционирование. Opus 4.7 — не самая мощная схема Anthropic: над ним стоит закрытая Claude Mythos Preview, которую компания раздала ограниченному кругу партнеров в контексте Project Glasswing и пока не выпускает публично из-за слишком сильных киберспособностей. В анонсе Anthropic прямо пишет, что во время обучения Opus 4.7 экспериментировала с дифференциальным снижением киберспособностей — то есть намеренно ослабила модель в этой области. На Opus 4.7 теперь обкатывают новые защиты, которые автоматически блокируют запросы с признаками запрещенного или высокорискового использования. Если тесты будут успешны, то со временем компания выпустит Mythos в общий доступ.

Важное, что стоит держать в уме: цена за токен не изменилась, но счет за те же задачи может вырасти. У Opus 4.7 обновлённый токенизатор, в связи с которого тот же вход мапится в 1,0–1,35× больше токенов в зависимости от типа контента. Плюс на высоких уровнях усилий схема генерирует больше рассуждений, особенно на поздних этапах агентских сценариев.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Авторы Telega: заказчик Telega не превращает iPhone в «кирпич» после обновления до iOS 26.4.1

48 минут назад

Авторы Telega: заказчик Telega не превращает iPhone в «кирпич» после обновления до iOS 26.4.1

Разработчики Telega заявили, что их альтернативный клиент Telegram не превращает iPhone в «кирпич» после обновления до iOS 26.4.1. В команде проекта пояснили. что проблемы в связи с обновления не связ

Инициатива World Альтмана интегрирует технологию верификации в приложения для знакомств

54 минуты назад

Инициатива World Альтмана интегрирует технологию верификации в приложения для знакомств

Инициатива Сэма Альтмана по верификации пользователей World заключает партнёрство с Tinder, чтобы интегрировать свою технологию верификации в программа для знакомств. Аналогичные технологии планируетс

Альтман покинет OpenAI перед IPO? Его сделки слишком часто обогащают не OpenAI, а его самого

58 минут назад

Альтман покинет OpenAI перед IPO? Его сделки слишком часто обогащают не OpenAI, а его самого

The Wall Street Journal опубликовала расследование о личных инвестициях CEO OpenAI Сэма Альтмана. Часть акционеров компании стартовали приватно обсуждать, стоит ли именно ему вести OpenAI на IPO с цел

В Duolingo прекратили отслеживать использование сотрудниками ИИ при оценке эффективности

1 час назад

В Duolingo прекратили отслеживать использование сотрудниками ИИ при оценке эффективности

В апреле 2025 года генеральный директор Duolingo Луис фон Ан объявил, что система будет отслеживать использование ИИ сотрудниками в процессе оценки их работы. Теперь топ-менеджер заявил, что этот пока

Исследование: для разблокировки по лицу на Android-смартфонах можно применять фото

2 часа назад

Исследование: для разблокировки по лицу на Android-смартфонах можно применять фото

Тесты в лабораториях Which выявили, что функцию блокировки по лицу во многих современных смартфонах можно обойти, используя лишь фотографию владельца. Читать далее