ИИ-сообщество представило крошечный трансформер для складывания 10-значных чисел

2 мин
ИИ-сообщество представило крошечный трансформер для складывания 10-значных чисел

Участники открытого челленджа AdderBoard довели минимальный трансформер, способный складывать два 10-значных числа, до 130 параметров — в 47 раз меньше исходной модели на 6 080 параметров. Модель достигает 100%-й точности на тестовой выборке из 10 000 примеров.

Все началось с эксперимента Димитриса Папаилиопулоса, профессора Висконсинского университета и исследователя Microsoft Research. В феврале он дал Claude Code и Codex одинаковое задание: обучить самый маленький трансформер, который складывает 10-значные числа с точностью не ниже 99%. Claude Code вернул схема на 6 080 параметров, Codex — на 1 644. Папаилиопулос описал эксперимент в посте "Сложение под давлением" и открыл лидерборд для всех желающих.

Сообщество быстро включилось в гонку. В лидерборде два трека: обученные модели, где веса находит алгоритм оптимизации, и модели с аналитически заданными весами — конструктивные доказательства того, что архитектура в общем способна представлять сложение. Рекорд среди обученных моделей — 311 параметров при точности 99,999%, среди аналитических — те самые 130. Ключевые приемы: факторизация ранга 1 и 3, разделение эмбеддингов, синусоидальное позиционное кодирование и обнаружение переноса через ReLU.

ЗПроблема выглядит тривиально, но для авторегрессивного трансформера сложение требует трех вещей одновременно: выравнивания цифр через механизм внимания, поразрядной арифметики в MLP-слое и пробрасывания переноса через последовательную генерацию. Участники обнаружили резкий фазовый переход точности в районе 800 параметров и выяснили, что однослойные архитектуры при равном бюджете обходят двухслойные.

AdderBoard — по сути, исследование нижней границы возможностей трансформеров на задаче, которую человек решает в столбик. Лидерборд открыт: любой может предложить свою схема через GitHub, пройти верификацию и попасть в таблицу.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Вышел PrismAudio — генерация звука прямо из видео

40 минут назад

Вышел PrismAudio — генерация звука прямо из видео

Лаборатория Tongyi Lab представила PrismAudio — новый каркас для задачи Video-to-Audio, то есть автоматической генерации звуковой дорожки по видеоряду. Инициатива стал развитием идей предыдущей модели

Microsoft называет Copilot «развлекательным инструментом»

46 минут назад

Microsoft называет Copilot «развлекательным инструментом»

В пользовательском соглашении Microsoft указано, что Copilot предназначен «только для развлекательных целей». Организация прямо предупреждает пользователей: ИИ может ошибаться, работать некорректно и

55 минут назад

Российское юридическое лицо Check Point показало выручку 394 млн рублей и зафиксировало убыток в 2025 году

Российское юридическое лицо израильского производителя межсетевых экранов Check Point по итогам 2025 года показало увеличение выручки на 2% и впервые зафиксировало чистый убыток. Выручка компании ООО

Anthropic на пике интереса инвесторов, но SpaceX может «перетянуть внимание»

1 час назад

Anthropic на пике интереса инвесторов, но SpaceX может «перетянуть внимание»

Компания Anthropic сейчас переживает настоящий бум на частных рынках. По данным инвестбанков и вторичного рынка, спрос на её акции настолько высокий, что инвесторы готовы вложить миллиарды долларов, а

1 час назад

«Яндекс» показал подборку промптов для подготовки школьников к экзаменам через «Алису AI»

«Яндекс» выпустил подборку промптов для подготовки к школьным экзаменам с помощью «Алисы AI». В экзаменационный период система «Промптхаб» и нейросеть помогают школьникам готовиться к Государственной