28 февраля 2026, 11:40
ИИ-сообщество представило крошечный трансформер для складывания 10-значных чисел

Участники открытого челленджа AdderBoard довели минимальный трансформер, способный складывать два 10-значных числа, до 130 параметров — в 47 раз меньше исходной модели на 6 080 параметров. Модель достигает 100%-й точности на тестовой выборке из 10 000 примеров.
Все началось с эксперимента Димитриса Папаилиопулоса, профессора Висконсинского университета и исследователя Microsoft Research. В феврале он дал Claude Code и Codex одинаковое задание: обучить самый маленький трансформер, который складывает 10-значные числа с точностью не ниже 99%. Claude Code вернул схема на 6 080 параметров, Codex — на 1 644. Папаилиопулос описал эксперимент в посте "Сложение под давлением" и открыл лидерборд для всех желающих.
Сообщество быстро включилось в гонку. В лидерборде два трека: обученные модели, где веса находит алгоритм оптимизации, и модели с аналитически заданными весами — конструктивные доказательства того, что архитектура в общем способна представлять сложение. Рекорд среди обученных моделей — 311 параметров при точности 99,999%, среди аналитических — те самые 130. Ключевые приемы: факторизация ранга 1 и 3, разделение эмбеддингов, синусоидальное позиционное кодирование и обнаружение переноса через ReLU.
ЗПроблема выглядит тривиально, но для авторегрессивного трансформера сложение требует трех вещей одновременно: выравнивания цифр через механизм внимания, поразрядной арифметики в MLP-слое и пробрасывания переноса через последовательную генерацию. Участники обнаружили резкий фазовый переход точности в районе 800 параметров и выяснили, что однослойные архитектуры при равном бюджете обходят двухслойные.
AdderBoard — по сути, исследование нижней границы возможностей трансформеров на задаче, которую человек решает в столбик. Лидерборд открыт: любой может предложить свою схема через GitHub, пройти верификацию и попасть в таблицу.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

40 минут назад
Вышел PrismAudio — генерация звука прямо из видео
Лаборатория Tongyi Lab представила PrismAudio — новый каркас для задачи Video-to-Audio, то есть автоматической генерации звуковой дорожки по видеоряду. Инициатива стал развитием идей предыдущей модели

46 минут назад
Microsoft называет Copilot «развлекательным инструментом»
В пользовательском соглашении Microsoft указано, что Copilot предназначен «только для развлекательных целей». Организация прямо предупреждает пользователей: ИИ может ошибаться, работать некорректно и
55 минут назад
Российское юридическое лицо Check Point показало выручку 394 млн рублей и зафиксировало убыток в 2025 году
Российское юридическое лицо израильского производителя межсетевых экранов Check Point по итогам 2025 года показало увеличение выручки на 2% и впервые зафиксировало чистый убыток. Выручка компании ООО

1 час назад
Anthropic на пике интереса инвесторов, но SpaceX может «перетянуть внимание»
Компания Anthropic сейчас переживает настоящий бум на частных рынках. По данным инвестбанков и вторичного рынка, спрос на её акции настолько высокий, что инвесторы готовы вложить миллиарды долларов, а
1 час назад
«Яндекс» показал подборку промптов для подготовки школьников к экзаменам через «Алису AI»
«Яндекс» выпустил подборку промптов для подготовки к школьным экзаменам с помощью «Алисы AI». В экзаменационный период система «Промптхаб» и нейросеть помогают школьникам готовиться к Государственной