5 марта 2026, 21:16
Вышла GPT-5.4 — первая схема OpenAI, которая управляет компьютером

OpenAI выпустила GPT-5.4 — новую флагманскую модель, которая заменяет сразу две предшественницы: GPT-5.2 (универсальную) и GPT-5.3-Codex (кодерскую). Контекстное окно выросло до 1,05 млн токенов — в 2,5 раза больше, чем у GPT-5.2. Одновременно GPT-5.4 — самая токеноэффективная схема серии: она тратит значительно меньше токенов на решение тех же задач, что частично компенсирует рост цены в api до $2,50 за миллион входных и $15 за миллион выходных токенов. Для сложных задач доступна GPT-5.4-pro ($30/$180).
Главная новинка — встроенный computer use: GPT-5.4 стала первой основной моделью OpenAI, которая умеет взаимодействовать с программами через оболочку — ознакомиться скриншоты, нажимать кнопки, заполнять формы и проверять результат. Раньше эта опция была доступна только в экспериментальных моделях. Еще одно нововведение — tool search, позволяющий подгружать определения инструментов по запросу, а не передавать все сразу. Это снижает расход токенов и улучшает точность выбора нужного инструмента в сложных агентных сценариях.
На бенчмарках GPT-5.4 заметнее всего прибавила именно в агентных задачах (далее все сравнения - с GPT-5.2): на OSWorld-Verified — 75% против 47,3% у GPT-5.2, на BrowseComp — 82,7% против 65,8%, на GDPval — 83% против 70,9%. Результаты на SWE-Bench Pro скромнее: 57,7% против 55,6%. Максимальный уровень рассуждений расширен до xhigh — режим "экстремального мышления", в котором модель тратит значительно больше вычислительных ресурсов на сложные задачи. Кроме того, OpenAI называет GPT-5.4 самой точной моделью: ложные утверждения встречаются на 33% реже, а доля ответов с ошибками снизилась на 18%.
Модель равным образом получила нативную поддержку компакции — сжатия контекста для длинных агентных сессий, чтобы не терять ключевую информацию при многошаговых задачах. GPT-5.4 стала дефолтной моделью и в api, и в Codex. В ChatGPT модель раскатывается прямо сейчас, пользователи Pro-подписки сразу получат Pro-версию.
Еще одно заметное изменение в ChatGPT: GPT-5.4 Thinking теперь показывает план работы перед выполнением сложного запроса — потребитель может скорректировать направление прямо в процессе, не дожидаясь готового ответа.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

51 минуту назад
Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике
Китайская компания-разработчик человекоподобных роботов UBTech Robotics ищет главного учёного по робототехнике, предлагая зарплату до $18 млн в год. Компания указывает, что эта должность будет определ

58 минут назад
Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS
Моддер с форума Overclock.net с помощью Claude целиком переписал BIOS материнской платы ASUS Z790 и загрузил Windows 11 на серверном 12-ядерном процессоре Intel Bartlett Lake Core 9 273PQE, который In

1 час назад
В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец
В подсистеме подключения устройств OpenClaw — ИИ-агента с 348 000 звезд на GitHub — за шесть недель обнаружили шесть уязвимостей класса CWE-863 (некорректная авторизация). Последняя, CVE-2026-33579 с

1 час назад
В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем
Valve тестирует в Steam средство для анализа FPS на конкретном ПК до покупки игры пользователем, сообщил датамайнер dex3108 на форуме ResetEra, обнаруживший строки кода этой функции. Сама организация

2 часа назад
Microsoft вложит $10 млрд в японские ИИ-проекты
До 2029 года Microsoft планирует инвестировать $10 млрд в инфраструктуру искусственного интеллекта и облачных вычислений Японии, пишет местное информационное агентство Kyodo News со ссылкой на вице-пр