Внутренняя схема OpenAI решила еще 5 математических задач Эрдёша

3 мин
Внутренняя схема OpenAI решила еще 5 математических задач Эрдёша

Команда математиков OpenAI — Борис Алексеев, Мо Паттерман, Мехтааб Сони, Марк Селлке и Грегори Валиант — выпустила на arXiv следующий препринт с решениями открытых задач, сформулированных Полом Эрдёшем. На этот раз задач пять: №960 про обычные прямые без "обычной клики", №987 про экспоненциальные суммы, №1091 про K4-free 4-хроматические графы, у которых все маленькие подграфы раскрашиваются в три цвета, №990 про разреженный вариант теоремы Эрдёша–Турана и №1141 про простые числа вида n − ak². Все пять доказательств целиком получены "внутренней моделью OpenAI", которая пока не доступна публике. Это прямое продолжение серии Short Proofs: первый препринт с тремя задачами вышел меньше двух недель назад.

Разработчики снова описывают свою роль предельно скромно — "переварить доказательства и отредактировать их для ясности и элегантности". Единственное содержательное изменение людьми внесено в доказательство для задачи №1091: исходный вариант модели опирался на представление через "склейки Хайоша", а авторы заменили его на более несложный аргумент через 2-вырожденность подграфов. По задаче №1141 модель доказала более общее утверждение, чем спрашивал Эрдёш: для любого фиксированного a≥1 только конечное число чисел n обладает свойством, что n − ak² простое для всех допустимых k. Исходная формулировка Эрдёша касалась только случая a=1.

Самое любопытное — эксперимент с GPT-5.4 Pro, самой мощной моделью компании, доступной сейчас публично. После того как авторы проверили решения внутренней модели, они пять раз независимо дали 5.4 Pro решить те же задачи. Из пяти задач модель справилась только с двумя: с задачей №960 (причем ее доказательство слабее — не закрывает случай, когда запрещенная клика имеет размер три) и с задачей №1141 (все пять попыток успешны). Остальные три задачи GPT-5.4 Pro не взял. В соцсетях уже появились предположения, что речь идет о внутренней модели под кодовым названием Spud, обучение которой OpenAI, по слухам, недавно завершила.

Особо выделяется подход задачи №1091, которое в X назвал любимым соавтор Мехтааб Сони. Эрдёш спрашивал: если у графа хроматическое число 4, а все маленькие подграфы раскрашиваются в три цвета, обязан ли он содержать нечетный цикл с большим числом хорд? Еще в 1982 году Хайнц-Юрген Восс доказал, что хотя бы две хорды у такого цикла найдутся. Внутренняя модель OpenAI закрыла усиленную версию вопроса: существует ли функция f(r), стремящаяся к бесконечности, такая что у нечетного цикла обязательно будет f(r) хорд. Ответ — нет: схема построила явный контрпример, семейство графов-"гусениц" из пятиугольных блоков, где у каждого цикла не больше десяти хорд. Сони предлагает читателям восстановить доказательство по картинке-схеме из препринта как упражнение — и отдельно отмечает, что саму схему нарисовал Codex.

ИИ решают задачи Эрдёша с начала этого года: в январе 2026-го связка GPT-5.2 Pro и Aristotle от Harmonic закрыла задачу №728 с машинной верификацией в Lean, а теперь внутренняя схема OpenAI представила за две недели уже восемь новых результатов в двух препринтах.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Глава Microsoft объяснил, почему ИИ не обесценит людей

1 час назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

3 часа назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

3 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

4 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

7 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения