В топ рейтинга ИИ попала схема правительства Рио-де-Жанейро на основе Qwen

4 мин
В топ рейтинга ИИ попала схема правительства Рио-де-Жанейро на основе Qwen

На рынке LLM неожиданная смена лидеров. Бразильская IT-компания IplanRIO, принадлежащая правительству Рио-де-Жанейро, представила open-source новинку Rio 3.5 Open 397B. 

Изначально заявлялось, что авторы дообучили китайскую Tongyi Qwen 3.5 от Alibaba и смогли создать подход, которое с ходу вошло в мировой топ-10 рейтинга ИИ, потеснив флагманские коммерческие системы — тем не менее за этим успехом скрывался совсем другой технический нюанс.

Архитектура и масштаб модели

Как схема привлекла внимание общественности? Все дело в масштабе модели — RIO 3.5 построена на базе архитектуры с 397 млрд параметров, и использует схему «Смеси экспертов». Во время генерации активируется часть параметров – 17 млрд на токен. Решение позволяет получить производительность моделей флагманского уровня, т.к. архитектура этой модели аналогична большинству самых успешных моделей.

Хоть основное соперничество в развитии нейросетей идет между Китаем и США, Бразилия громко заявила о себе — RIO развивается по схеме, приносящей успех многим открытым моделям: за базу берутся готовая архитектура и передовые наработки, которые затем модифицируются для повышения качества работы

Главные плюсы

Из основных плюсов (по заявлению разработчиков) можно выделить:

  • Интеграция SwiReasoning. Функция динамически переключаться между явным выводом и выводом в латентном пространстве для достижения оптимального баланса между точностью и эффективностью;

  • Отличные результаты в рассуждении, выполнении команд и многомодальных задачах, наравне с знаменитыми моделями; 

  • Хорошо понимает многие языки — результаты на английском, китайском и более пятнадцати других языков на высоком уровне;

  • Лицензия MIT. Она снимает запреты с этого полностью открытого кода, такие как  использование в коммерческих целях или изменение.

Ключевое, на мой взгляд, преимущество – огромная длина контекста. Rio 3.5 поддерживает контекст в один миллион токенов, что даёт возможность анализировать крупные тексты и большие объемы кода, исследовательские материалы и научные работы — все это без необходимости постоянно дробить информацию на части, как бывает в том же ChatGPT. 

Облачная инфраструктура для ваших проектов

Виртуальные машины в Москве, Санкт-Петербурге и Новосибирске с оплатой по потреблению.

Подробнее →

Недостатки и требования к железу

Из недостатков можно отметить:

Слишком большая перегруженность модели – использовать такую архитектуру можно, но для этого требуется серьезные вычислительные ресурсы. Полноценный запускание такой модели остается недоступным для обывателей.

Чтобы запустить Rio 3.5 в оригинальном качестве (FP16), потребуется около 880 ГБ VRAM — это четыре серверных чипа Blackwell Ultra. Даже со сжатием (INT4) модели нужно не менее 220 ГБ видеопамяти, так что просто на домашнем ПК ее не развернуть.

Необкатанная схема — преимущества основаны на результатах тестировщиков и разработчиков, обычные пользователи пока не сложили мнения о модели.

Правда, почти сразу вспыхнул скандал. Исследователи из Nex-AGI заявили, что бразильцы модель вообще не обучали, а сделали чистый математический мерж весов оригинальной Qwen 3.5 и их собственной Nex-N2 Pro. Более того, когда у Rio стерли системный промпт, она начала отвечать: «Я — Nex». IplanRIO уже извинились на Hugging Face, сославшись на то, что инженеры случайно залили не тот файл. 

Доказательство подмены весов: в ответах api модель rio-397b прямо называет себя чужим именем — Nex от Nex-AGI. Ресурс.

Хоть схема за счет интеграции SwiReasoning и выдает результаты сильнее базовой Qwen 3.5, конкурируя по ряду тестов с закрытыми флагманами, до фундаментального технологического прорыва она не дотягивает. Однако бесконечно штамповать подобные решения без потери качества невозможно — этот блендинг сработал только благодаря близкой архитектурной генетике исходных моделей, чьи веса идеально подошли друг к другу. 

Диаграмма бенчмарков от разработчиков Rio. Стоит учесть, что сравнение идет с закрытыми коммерческими версиями вроде Qwen 3.7 Plus, тогда как базовая схема Qwen 3.5 на графике намеренно отсутствует. Минимальный отрыв в ряде тестов находится в пределах погрешности и обусловлен внешней надстройкой SwiReasoning. Источник.

Что в итоге

Теперь не только Китай удивляет своими интересными решениями в области ИИ, но и Бразилия. Хоть США и является лидером по выручке, монополия в области создания нейросетей сходит на нет. Благодаря открытым базовым моделям, новым методам дообучения и более эффективным архитектурам в борьбу за лидерство будут вступать новые игроки. 

Время покажет, сможет ли IplanRIO выпустить свою финальную очищенную версию, но сам прецедент с Rio 3.5 уже стал предметом главных обсуждений в Кремниевой долине. История показала, что open-source сообщество способно мгновенно выводить на рынок сильные решения и так же быстро выводить их создателей на чистую воду, подпитывая огонь конкуренции среди больших языковых моделей.

Протестировать Rio 3.5 Open 397B уже можно через страницу модели на Hugging Face

Читают сейчас

Мертвый интернет ожил? DeepSeek подключили к World of Warcraft серверу с 1800 ботами

36 минут назад

Мертвый интернет ожил? DeepSeek подключили к World of Warcraft серверу с 1800 ботами

Энтузиаст поднял частный хост World of Warcraft эпохи Wrath of the Lich King и заселил его около 1800 ботами, чат которых обрабатывает DeepSeek. Итог он представил на Reddit — это маленький любительск

AI Hardcore Set: MCP, агенты и защита GenAI — офлайн-встреча в Авито

41 минуту назад

AI Hardcore Set: MCP, агенты и защита GenAI — офлайн-встреча в Авито

11 июля в московском офисе Авито (Лесная, 7) пройдёт AI Hardcore Set — встреча для тех, кто уже работает с MCP и агентами в проде, а не только читает об этом. Четыре доклада без записи — про Spec-Driv

Эффект AirPods: гарнитура сильно меняют то, как люди взаимодействуют друг с другом в обществе

46 минут назад

Эффект AirPods: гарнитура сильно меняют то, как люди взаимодействуют друг с другом в обществе

Журналист Маркхэм Хейд в колонке рассказал про «эффект AirPods» — привычку постоянно носить беспроводные гарнитура, что делает людей менее доступными для случайных разговоров. Всё чаще пользователи сп

К2Тех перевел 7500 пользователей крупной газовой компании с Microsoft Exchange на VK WorkSpace

59 минут назад

К2Тех перевел 7500 пользователей крупной газовой компании с Microsoft Exchange на VK WorkSpace

ИТ-компания К2Тех реализовала проект по миграции 7 500 пользователей компании из газовой отрасли с Microsoft Exchange на отечественную почтовую систему VK WorkSpace. Проект был выполнен в режиме высок

PVS-Studio 7.43: аналитика Unreal Engine для Team, сопровождение Zephyr SDK и многое другое

1 час назад

PVS-Studio 7.43: аналитика Unreal Engine для Team, сопровождение Zephyr SDK и многое другое

Вышел новый релиз PVS-Studio — 7.43. В нём: плагин поддержки MISRA C++ 2023, возможность анализировать Unreal Engine проекты на Team лицензии, поддержка Zephyr SDK и многое другое. Читать далее