7 часов назад

ИИ должен учиться непрерывно, чтобы стать AGI. Но с этим задача

3 мин

Чтобы приблизиться к настоящему универсальному ИИ (AGI), схема должна уметь дообучаться без остановки — впитывать новые факты и навыки прямо по мере работы. Новое исследование лаборатории Zyphra показало, что большие языковые модели справляются с этим плохо: после долгого обучения они постепенно теряют саму способность усваивать новое. Важно не перепутать: речь не про забывание и не про "поглупение". Старое схема помнит прекрасно — она именно разучивается учиться. Похоже на опытного сотрудника, который ничего из накопленного не растерял, но за годы в одной колее все тяжелее берется за незнакомые задачи. У этого явления есть имя — потеря пластичности.

Чтобы поймать эффект, модели разных размеров — от 5 до 314 млн параметров — долго прогоняли через поток из восьми языков (английский, русский, китайский, французский, японский и так далее), а время от времени проверяли, насколько быстро они выучивают совсем свежий язык, которого в потоке не было, — вьетнамский. Картина получилась наглядной: чем дольше шло обучение, тем хуже модели давался этот новичок.

Основной вопрос был про масштаб: спасает ли он? И да, и нет. Чем крупнее схема, тем позже наступает эта "закостенелость" — но "никогда" не наступает ни у одной. Размер лишь оттягивает момент, причем со все меньшей отдачей: момент наступления подчиняется простому степенному закону и растет медленнее, чем сама модель. Грубо говоря, просто раздуть модель, чтобы избавиться от проблемы, не выйдет — это неэффективный путь. По прогнозу из той же формулы (именно прогноз, прямых замеров на таких размерах нет) модель на миллиард параметров начала бы терять пластичность примерно к 1,8 трлн обработанных токенов. И самый неуютный результат: эффект проявился даже при обычном длительном предобучении на стационарных данных, а не только в искусственном сценарии с резким переключением языков.

Почему это вообще занимает исследователей. Непрерывное обучение могло бы снять одну из главных болей нынешних моделей — knowledge cuttof или фиксированную "дату знаний", после которой модель ничего не знает о мире. Тот же алгоритм позволил бы, например, кодинг-агенту осваивать новую кодовую базу по ходу дела, а не затаскивать ее полностью в гигантский промпт. Если же способность учиться со временем тает, вся эта картина непрерывно адаптирующегося ИИ упирается в стену.

Важно, что модели в эксперименте небольшие по меркам фронтира; цифры про миллиард параметров — экстраполяция, а не наблюдение. Механизма разработчики тоже пока не нашли: они проверили обычных подозреваемых — затухающие нейроны, "обленившиеся" головы внимания, рост весов, — но ни один не объясняет эффект целиком.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Zyphra

Читают сейчас

36 минут назад

Президент РФ подписал закон о штрафах за авторизацию через иностранные сервисы и нарушения рекомендательных технологий

Президент России подписал закон, который вводит административные штрафы за нарушения правил авторизации пользователей на российских сайтах. Кодекс об административных правонарушениях дополняется новым

47 минут назад

ASUS возвращает шифрование памяти TSME на платы AM5 для Ryzen 9000

Организация ASUS опубликовала бета-версии BIOS для материнских плат с сокетом AM5, которые восстанавливают поддержку технологии Transparent Secure Memory Encryption™ для потребительских процессоров ли

1 час назад

Новые модели ChatGPT пугают даже правительство США: почему в след за Fable 5 не вышла GTP-5.6

Совсем недавно правительство США, увидев возможности выходящей версии ChatGPT 5.6, попросило компанию OpenAI отложить до неопределенного срока версия агента и предоставить его только тем компаниям, ко

1 час назад

Минцифры РФ разработало инициатива требований к оборудованию виртуальных АТС для нужд ОРМ

Минцифры РФ подготовило проект требований к оборудованию виртуальных телефонных станций (ВАТС). Документ определяет, каким условиям должны соответствовать системы коммутации в составе виртуальных АТС.

1 час назад

Ford вернула бывших инженеров для устранения недочётов, допущенных автоматизированными системами

Ford вернула в штат бывших инженеров, чтобы обучить молодых сотрудников и перепрограммировать инструменты искусственного интеллекта, которые не справлялись со своей задачей, пишет Bloomberg. За послед