Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

2 мин
Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

Основатель Eureka Labs, бывший директор по ИИ в Tesla и один из основателей OpenAI Андрей Карпати выложил в публичный доступ проект autoresearch — систему, в которой ИИ-агент автономно проводит эксперименты по обучению языковых моделей на одном GPU. Агент сам модифицирует исходник, запускает пятиминутный цикл обучения, проверяет метрику качества и решает — сохранить изменения или откатить. Затем цикл повторяется. За час набирается приблизительно 12 экспериментов, за ночь — до сотни.

Главная идея проекта — человек больше не пишет Python-код как обычный исследователь. Вместо этого он редактирует Markdown-файл program.md — по существу, инструкцию для агента: что пробовать, как оценивать результат, когда откатываться. Агент же итерирует единственный файл train.py (~630 строк), в котором собрана архитектура GPT, оптимизаторы Muon и AdamW и весь тренировочный цикл. Метрика — val_bpb (биты на байт на валидации) — не зависит от размера словаря, поэтому эксперименты сопоставимы даже при замене архитектуры.

Каждый эксперимент длится ровно 5 минут — независимо от того, что именно поменял агент: размер модели, батч, гиперпараметры или архитектуру целиком. Это делает результаты сопоставимыми между собой, хотя и привязывает их к конкретному GPU (инициатива тестировался на H100).

Карпати предложил смотреть на проект как на соревнование: кто напишет лучший program.md — тот добьется самого быстрого исследовательского прогресса. А в эпиграфе к репозиторию пошутил, что эра «мясных компьютеров», которые синхронизировались звуковыми волнами на «групповых совещаниях», давно прошла — теперь исследования ведут автономные рои агентов.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике

51 минуту назад

Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике

Китайская компания-разработчик человекоподобных роботов UBTech Robotics ищет главного учёного по робототехнике, предлагая зарплату до $18 млн в год. Компания указывает, что эта должность будет определ

Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS

58 минут назад

Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS

Моддер с форума Overclock.net с помощью Claude целиком переписал BIOS материнской платы ASUS Z790 и загрузил Windows 11 на серверном 12-ядерном процессоре Intel Bartlett Lake Core 9 273PQE, который In

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

1 час назад

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

В подсистеме подключения устройств OpenClaw — ИИ-агента с 348 000 звезд на GitHub — за шесть недель обнаружили шесть уязвимостей класса CWE-863 (некорректная авторизация). Последняя, CVE-2026-33579 с

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

1 час назад

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

Valve тестирует в Steam средство для анализа FPS на конкретном ПК до покупки игры пользователем, сообщил датамайнер dex3108 на форуме ResetEra, обнаруживший строки кода этой функции. Сама организация

Microsoft вложит $10 млрд в японские ИИ-проекты

2 часа назад

Microsoft вложит $10 млрд в японские ИИ-проекты

До 2029 года Microsoft планирует инвестировать $10 млрд в инфраструктуру искусственного интеллекта и облачных вычислений Японии, пишет местное информационное агентство Kyodo News со ссылкой на вице-пр