5 мая 2026, 16:08
Mistral Medium 3.5: новая открытая схема и облачные агенты Vibe

Французская Mistral представила Medium 3.5 — плотную (не MoE) схема на 128 млрд параметров с контекстом 256k токенов и открытыми весами под модифицированной MIT-лицензией. Одновременно компания запустила облачных агентов в Vibe и режим Work mode в Le Chat. На SWE-bench Verified модель набирает 77,6%, на агентном τ³-Telecom — 91,4%. Веса уже выложены на Hugging Face.
Medium 3.5 — первая "объединенная" схема Mistral: она заменяет сразу три предыдущих. Medium 3.1 отвечала за чат, Magistral — за рассуждения, Devstral 2 — за исходник. Теперь все три задачи решает один набор весов, причем уровень глубины рассуждений переключается под запрос — от быстрого ответа до длинного агентного прогона. Схема мультимодальная, vision-энкодер обучен с нуля под изображения произвольных размеров и пропорций. Для запуска потребуется 4 GPU. Цена api — $1,5 за миллион входных токенов и $7,5 за миллион выходных, примерно вдвое дешевле Claude Sonnet 4.6.

Параллельно с моделью запущены Vibe Remote Agents. Это облачные сессии кодинг-агентов, которые работают в изолированных песочницах: запускаешь задачу из CLI или прямо из Le Chat, агент сам правит исходник, ставит зависимости, гоняет тесты и в конце открывает pull request на GitHub. Локальную CLI-сессию можно "телепортировать" в облако наряду с историей и состоянием — освободить ноут и забрать готовую ветку позже. Vibe интегрируется с GitHub, Linear, Jira, Sentry, Slack и Teams. Плюс Mistral открыла превью Work mode в Le Chat — тот же решение, но уже не про исходник: почта, календарь, документация, мультишаговые задачи с обязательным подтверждением чувствительных действий.
С бенчмарками картина неоднозначная. 77,6% на SWE-bench Verified — это близко к прошлогоднему Claude Sonnet 4.5 (77,2%), но заметно ниже актуального рейтинга. Claude Opus 4.7, вышедший 16 апреля, демонстрирует 87,6%, прошлое поколение Opus 4.6 — 80,8%. От текущего лидера Medium 3.5 отстает примерно на 10 п.п. и проигрывает даже прошлому поколению Opus, а среди открытых моделей не догоняет DeepSeek V4-Pro. Но важно понимать, что размер модели и требования для запуска значительно ниже.
Ставка Mistral, судя по всему, не на верхнюю строчку рейтинга, а на операционную точку "открытые веса + dense-архитектура + локальный запуск от 4 GPU + готовая агентская инфраструктура". На фоне MoE-консенсуса (DeepSeek, Qwen, последние релизы Llama) Mistral идет против тренда: для команд, которые запускают модель у себя, dense проще — предсказуемая память и латентность, файнтюн без коллапса экспертов, никакой возни с маршрутизацией при инференсе. На SWE-bench среди открытых моделей результат все еще конкурентный, а связка с Vibe и интеграциями превращает релиз в готовый продукт, а не просто набор весов на Hugging Face.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

3 часа назад
Глава Microsoft объяснил, почему ИИ не обесценит людей
Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

5 часов назад
Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках
Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

6 часов назад
Google отключил оператор inurl
Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

6 часов назад
Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat
13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

9 часов назад
Microsoft выпустила версию PowerToys 0.100.0
Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения