
27 мая 2026, 13:49
Свежий тест производительности DeepSWE: GPT-5.5 — 70%, Opus 4.7 — 54%
Новый тест производительности DeepSWE показал, что GPT-5.5 решает 70% задач по разработке ПО, тогда как Claude Opus 4.7 — 54%. На SWE-Bench Pro картина была ровно обратной: там Opus 4.7 занимал первое

27 мая 2026, 10:25
«Opus 4.7 подсматривает ответы!»: Datacurve раскритиковала тест производительности SWE-Bench Pro — и выпустила свой
Claude Opus 4.6 и 4.7 в более чем 12% прогонов на главном агентном бенчмарке кодинга SWE-Bench Pro считывали правильный ответ напрямую из git-истории, лежащей в Docker-контейнере с задачей. GPT-5.4 и

27 мая 2026, 00:27
Британская «красная команда» взломала ChatGPT за 6 часов — а полномочий у нее ноль
Газета New York Times опубликовала репортаж из британского AI Security Institute (AISI) — государственного института на сто человек, который ищет дыры в самых мощных ИИ-моделях. Команде хватило шести

20 мая 2026, 23:21
«Не сетка»: ИИ впервые в истории сам решил центральную проблему геометрии
OpenAI сообщила, что ее внутренняя схема опровергла гипотезу Эрдёша 1946 года о единичных расстояниях — одну из самых известных задач комбинаторной геометрии. Это первый случай, когда центральная откр

18 мая 2026, 13:45
OpenAI запустила ChatGPT для управления финансами с возможностью привязки банковских счетов
OpenAI запустила ChatGPT, предназначенный для управления личными финансами. Пользователи могут привязать к чат-боту свои банковские счета и консультироваться касательно платежей, подписок, инвестиций,

16 мая 2026, 17:35
OpenAI запустила финансовые инструменты в ChatGPT с подключением банковских аккаунтов
OpenAI запустила набор инструментов для персональных финансов в ChatGPT. Пока опция доступна в preview для пользователей ChatGPT Pro в США. Свежий раздел позволяет подключать банковские и инвестиционн

15 мая 2026, 10:32
«Гипотезу Римана может доказать анонимный аккаунт»: математик MIT — об опыте работы с GPT-5.5-Pro
Дэвид Туртуреан, аспирант MIT, опубликовал в X подход задачи #696 из списка Эрдёша через GPT-5.5-Pro — и обнаружил, что днем раньше на форуме erdosproblems.com уже появилось детальное частичное решени

15 мая 2026, 00:12
Codex добавили в портативный ChatGPT — для всех планов, в том числе бесплатный
OpenAI запустила Codex в мобильном приложении ChatGPT в режиме preview. Версии для iOS и Android раскатывают на всех тарифах — включая Free и Go. По данным компании, кодинг-агентом сейчас пользуются б

12 мая 2026, 07:00
Gmail, Salesforce и LinkedIn в одном агенте: OpenAI опубликовал Codex для Chrome
OpenAI 7 мая опубликовал плагин Codex для Chrome — агент получает прямой доступ к залогиненным сессиям пользователя на любых сайтах: от Gmail и LinkedIn до Salesforce и корпоративных панелей. Поводом