OpenAI выпустила GPT-5.4 — свою новую флагманскую схема

2 мин
OpenAI выпустила GPT-5.4 — свою новую флагманскую схема

Главное модификация: модель объединила возможности кодинга из GPT-5.3-Codex с улучшенным рассуждением из GPT-5.2. Раньше это были отдельные модели под разные задачи, теперь одна.

На бенчмарке GDPval, где модели выполняют рабочие задачи по 44 профессиям (презентации, таблицы, графики, расписания), GPT-5.4 совпала с уровнем профессионалов или превзошла их в 83% случаев. У GPT-5.2 было 70.9%.

На внутреннем тесте задач инвестиционного анализ схема набрала 87.3% против 68.4% у предшественника. На OSWorld, где модель управляет десктопом через скриншоты и клавиатуру, итог вырос с 47.3% до 75% — это выше человеческого показателя в 72.4%.

Отдельная новинка — tool search. Раньше все определения инструментов загружались в контекст сразу, даже если модель ими не пользовалась. Это съедало тысячи токенов на каждый запрос. Теперь схема получает список доступных инструментов и подгружает нужные по мере необходимости. На тесте из 250 задач с 36 MCP-серверами это сократило расход токенов на 47% при том же качестве.

Контекстное окно — до 1 миллиона токенов.

Цена в программный интерфейс выросла: $2.50 за миллион входных токенов против $1.75 у GPT-5.2, выходные почти не изменились — $15 против $14.

ИРесурс: https://openai.com/index/introducing-gpt-5-4/

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике

51 минуту назад

Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике

Китайская компания-разработчик человекоподобных роботов UBTech Robotics ищет главного учёного по робототехнике, предлагая зарплату до $18 млн в год. Компания указывает, что эта должность будет определ

Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS

59 минут назад

Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS

Моддер с форума Overclock.net с помощью Claude целиком переписал BIOS материнской платы ASUS Z790 и загрузил Windows 11 на серверном 12-ядерном процессоре Intel Bartlett Lake Core 9 273PQE, который In

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

1 час назад

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

В подсистеме подключения устройств OpenClaw — ИИ-агента с 348 000 звезд на GitHub — за шесть недель обнаружили шесть уязвимостей класса CWE-863 (некорректная авторизация). Последняя, CVE-2026-33579 с

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

1 час назад

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

Valve тестирует в Steam средство для анализа FPS на конкретном ПК до покупки игры пользователем, сообщил датамайнер dex3108 на форуме ResetEra, обнаруживший строки кода этой функции. Сама организация

Microsoft вложит $10 млрд в японские ИИ-проекты

2 часа назад

Microsoft вложит $10 млрд в японские ИИ-проекты

До 2029 года Microsoft планирует инвестировать $10 млрд в инфраструктуру искусственного интеллекта и облачных вычислений Японии, пишет местное информационное агентство Kyodo News со ссылкой на вице-пр