Qwen 3.5 Medium — серия средних моделей, которые бьют прошлый флагман

2 мин
Qwen 3.5 Medium — серия средних моделей, которые бьют прошлый флагман

Неделю назад Alibaba выпустила Qwen3.5-397B-A17B — флагман линейки. Сегодня вышли модели поменьше, и цифры у них интересные.

  • Qwen3.5-35B-A3B — MoE, 35B параметров, 3B активных на токен. Превосходит Qwen3-235B-A22B, который был основной open-weight моделью Qwen3. МСхема в 7 раз меньше, а результаты лучше. Облачная релиз — Qwen3.5-Flash (контекст до 1M токенов, встроенные tools).

  • Qwen3.5-122B-A10B — MoE, 122B параметров, 10B активных. По бенчмаркам на уровне флагманской 397B, а на части задач (TAU2-Bench, BFCL-V4, HLE) обходит её.

  • Qwen3.5-27B — dense, все 27B параметров активны. На SWE-bench Verified набирает 72.4% — столько же, сколько 397B. На IFEval (следование инструкциям) — 95.0%, лучший результат во всей линейке.

Все модели построены на hybrid architecture: Gated Delta Networks (линейное внимание) + sparse MoE. 3 из 4 слоёв используют линейное внимание, что даёт серьёзный прирост в скорости на длинных контекстах. В 3.5 серии Alibaba перешла на эту архитектуру полностью, и разница видна — Qwen3.5-397B декодирует в 7.2 раза быстрее, чем Qwen3-235B при контексте 256K.

Все модели мультимодальные (текст + картинки через early fusion). Все модели под Apache 2.0.

Отдельно выложили Qwen3.5-35B-A3B-Base — релиз без файнтюна, для кастомного дообучения.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

Разработчик Amazon выявил регрессию в тестовом ядре Linux 7.0, в два раза снижающую эффективность PostgreSQL

10 минут назад

Разработчик Amazon выявил регрессию в тестовом ядре Linux 7.0, в два раза снижающую эффективность PostgreSQL

Разработчик из Amazon Сальваторе Дипьетро обнаружил регрессию при тестировании СУБД PostgreSQL и компонентов готовившегося к релизу ядра Linux 7.0. Выпуск новой версии ядра Linux, которая будет исполь

Экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны

1 час назад

Экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны

В НАСА сообщили, что экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны. В настоящий момент корабль находится приблизительно в 141 тыс. км от Луны

Представлен публике дистрибутив Netrunner 26 на Debian 13 «Trixie» и Linux 6.16

1 час назад

Представлен публике дистрибутив Netrunner 26 на Debian 13 «Trixie» и Linux 6.16

В начале апреля 2026 года разработчик проекта Nitrux Ури Эррера объявил о выпуске и общедоступности сборки Netrunner 26 (кодовое название Twilight), спустя более года после выхода Netrunner 25. Инициа

Версия библиотеки meshoptimizer 1.1

2 часа назад

Версия библиотеки meshoptimizer 1.1

2 апреля 2026 года разработчик Arseny Kapoulkine (zeux) представил обновление открытой библиотеки meshoptimizer 1.1. Исходный исходник проекта написан на C++ и JavaScript и опубликован на GitHub под л

Claude Code нашел 23-летний дефект в Linux

8 часов назад

Claude Code нашел 23-летний дефект в Linux

Николас Карлини, исследователь из Anthropic, рассказал на конференции [un]prompted 2026, что с помощью Claude Code обнаружил несколько удаленно эксплуатируемых уязвимостей в ядре Linux. Одна из них —