Вышла GPT-5.4 — первая схема OpenAI, которая управляет компьютером

2 мин
Вышла GPT-5.4 — первая схема OpenAI, которая управляет компьютером

OpenAI выпустила GPT-5.4 — новую флагманскую модель, которая заменяет сразу две предшественницы: GPT-5.2 (универсальную) и GPT-5.3-Codex (кодерскую). Контекстное окно выросло до 1,05 млн токенов — в 2,5 раза больше, чем у GPT-5.2. Одновременно GPT-5.4 — самая токеноэффективная схема серии: она тратит значительно меньше токенов на решение тех же задач, что частично компенсирует рост цены в api до $2,50 за миллион входных и $15 за миллион выходных токенов. Для сложных задач доступна GPT-5.4-pro ($30/$180).

Главная новинка — встроенный computer use: GPT-5.4 стала первой основной моделью OpenAI, которая умеет взаимодействовать с программами через оболочку — ознакомиться скриншоты, нажимать кнопки, заполнять формы и проверять результат. Раньше эта опция была доступна только в экспериментальных моделях. Еще одно нововведение — tool search, позволяющий подгружать определения инструментов по запросу, а не передавать все сразу. Это снижает расход токенов и улучшает точность выбора нужного инструмента в сложных агентных сценариях.

На бенчмарках GPT-5.4 заметнее всего прибавила именно в агентных задачах (далее все сравнения - с GPT-5.2): на OSWorld-Verified — 75% против 47,3% у GPT-5.2, на BrowseComp — 82,7% против 65,8%, на GDPval — 83% против 70,9%. Результаты на SWE-Bench Pro скромнее: 57,7% против 55,6%. Максимальный уровень рассуждений расширен до xhigh — режим "экстремального мышления", в котором модель тратит значительно больше вычислительных ресурсов на сложные задачи. Кроме того, OpenAI называет GPT-5.4 самой точной моделью: ложные утверждения встречаются на 33% реже, а доля ответов с ошибками снизилась на 18%.

Модель равным образом получила нативную поддержку компакции — сжатия контекста для длинных агентных сессий, чтобы не терять ключевую информацию при многошаговых задачах. GPT-5.4 стала дефолтной моделью и в api, и в Codex. В ChatGPT модель раскатывается прямо сейчас, пользователи Pro-подписки сразу получат Pro-версию.

Еще одно заметное изменение в ChatGPT: GPT-5.4 Thinking теперь показывает план работы перед выполнением сложного запроса — потребитель может скорректировать направление прямо в процессе, не дожидаясь готового ответа.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике

51 минуту назад

Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике

Китайская компания-разработчик человекоподобных роботов UBTech Robotics ищет главного учёного по робототехнике, предлагая зарплату до $18 млн в год. Компания указывает, что эта должность будет определ

Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS

58 минут назад

Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS

Моддер с форума Overclock.net с помощью Claude целиком переписал BIOS материнской платы ASUS Z790 и загрузил Windows 11 на серверном 12-ядерном процессоре Intel Bartlett Lake Core 9 273PQE, который In

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

1 час назад

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

В подсистеме подключения устройств OpenClaw — ИИ-агента с 348 000 звезд на GitHub — за шесть недель обнаружили шесть уязвимостей класса CWE-863 (некорректная авторизация). Последняя, CVE-2026-33579 с

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

1 час назад

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

Valve тестирует в Steam средство для анализа FPS на конкретном ПК до покупки игры пользователем, сообщил датамайнер dex3108 на форуме ResetEra, обнаруживший строки кода этой функции. Сама организация

Microsoft вложит $10 млрд в японские ИИ-проекты

2 часа назад

Microsoft вложит $10 млрд в японские ИИ-проекты

До 2029 года Microsoft планирует инвестировать $10 млрд в инфраструктуру искусственного интеллекта и облачных вычислений Японии, пишет местное информационное агентство Kyodo News со ссылкой на вице-пр