17 марта 2026, 16:10
Mistral AI показала Leanstral: кодинг, который можно не проверять

Французская Mistral AI представила Leanstral – открытого ИИ-агента, который не просто генерирует, а ещё и формально доказывает корректность своих же творений. Это помощник, который работает в связке с инструментом формального доказательства Lean 4. Его проблема – помогать в “инженерии доказательств”, то есть строго проверять математические выкладки и программные спецификации.
В Mistral рассудили здраво: зачем нам просто “умная” нейросеть? Будущее – за агентами, которые умеют не только выполнять задачи, но и расписываться за каждую строчку, строго следуя спецификациям. Leanstral стал первым крупным шагом в этом направлении.
Leanstral построен на архитектуре состава экспертов (MoE), которую оптимизировали специально для задач доказательства. Секрет в том, что схема использует лишь часть своих параметров (активных – около 6 миллиардов), выбирая нужные экспертные модули для конкретной задачи. Это позволяет ей быть одновременно производительной и экономичной. За счёт тому что Lean выступает в роли идеального верификатора, Leanstral может параллельно генерировать и проверять кучу вариантов решений.
Авторы уже сравнили своего новичка с другими моделями. Для теста использовали бенчмарк FLTEval, который оценивает завершение формальных доказательств и корректное определение новых математических концепций.

Как видно на графике, даже самый мощный из открытых соперников, Qwen3.5 (397B-A17B), добрался до отметки 25,4 за 4 попытки. Leanstral же (притом что у него всего 120B параметров с учётом всех экспертов и 6B активных) за 2 попытки выдаёт 26,3, а за 4 попытки и вовсе улетает к 29,3.
Но самое интересное – это сравнение с коллегами из семейства Claude. Leanstral оказался не просто конкурентоспособным, а невероятно экономичным. Claude Sonnet 4.6 стоит 549 $ и выдаёт скромные 23,7 балла. Leanstral за 36 $ (pass@2) набирает 26,3 балла, обгоняя его почти на 3 пункта и одновременно оказываясь в 15 раз дешевле. Но Claude Opus 4.6 с его 39,6 балла всё ещё впереди.
Подробности на официальном сайте Mistral AI и в документации.
Читают сейчас

11 минут назад
Разработчик Amazon выявил регрессию в тестовом ядре Linux 7.0, в два раза снижающую эффективность PostgreSQL
Разработчик из Amazon Сальваторе Дипьетро обнаружил регрессию при тестировании СУБД PostgreSQL и компонентов готовившегося к релизу ядра Linux 7.0. Выпуск новой версии ядра Linux, которая будет исполь

1 час назад
Экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны
В НАСА сообщили, что экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны. В настоящий момент корабль находится приблизительно в 141 тыс. км от Луны

1 час назад
Представлен публике дистрибутив Netrunner 26 на Debian 13 «Trixie» и Linux 6.16
В начале апреля 2026 года разработчик проекта Nitrux Ури Эррера объявил о выпуске и общедоступности сборки Netrunner 26 (кодовое название Twilight), спустя более года после выхода Netrunner 25. Инициа

2 часа назад
Версия библиотеки meshoptimizer 1.1
2 апреля 2026 года разработчик Arseny Kapoulkine (zeux) представил обновление открытой библиотеки meshoptimizer 1.1. Исходный исходник проекта написан на C++ и JavaScript и опубликован на GitHub под л

8 часов назад
Claude Code нашел 23-летний дефект в Linux
Николас Карлини, исследователь из Anthropic, рассказал на конференции [un]prompted 2026, что с помощью Claude Code обнаружил несколько удаленно эксплуатируемых уязвимостей в ядре Linux. Одна из них —