GLM-5.1 — китайский кодинг-агент, который стоит попробовать

3 мин
GLM-5.1 — китайский кодинг-агент, который стоит попробовать

Пока Anthropic бодается с OpenAI, китайцы продолжают дышать в спину. Zhipu AI дропнул модель, которая в Claude Code показывает 94.6% от Opus 4.6 - за $3 в месяц. Обучена полностью на Huawei Ascend, без единого чипа Nvidia. Кратко, что это значит на практике для тех, кто вайб-кодит и полагает токены.

Вчера Zhipu AI (они же Z.ai) выкатили GLM-5.1- апдейт своей флагманской модели, заточенный конкретно под кодинг. По их внутреннему бенчмарку через Claude Code схема набрала 45.3 балла против 47.9 у Opus 4.6, то есть 94.6% от топа. А по сравнению с базовым GLM-5, который вышел в феврале, это прирост на 28% - с 35.4 до 45.3. SWE-bench Verified у базы - 77.8, что уже было лучшим среди открытых моделей. Важный нюанс: бенчмарки пока чисто китайские, независимой верификации еще нет, так что числа стоит воспринимать на веру.

Как подключить к Claude Code

Для вайб-кодинга главное что? Правильно - практика и бесконечные деньги на токены. GLM-5.1 работает прямо через Claude Code, достаточно подправить ~/.claude/settings.json, прописав в env переменных ANTHROPIC_BASE_URL на эндпоинт Z.ai и свой api-ключ. Модель маппится на Opus. Есть даже CLI-обёртка glm на GitHub, которая делает это через временные env-переменные, не трогая ваш основной конфиг - удобно, если хотите держать и Anthropic, и GLM параллельно. Для пользователей Max-плана GLM-5.1 нужно явно прописать "glm-5.1" в маппинге. Подробная инструкция здесь, в официальной документации.

Экономика токенов

Теперь про деньги, потому что для нас, вайб-кодеров, это один из решающих факторов. GLM Coding Plan стартует от $3/мес (промо, 120 промптов) до $30/мес за Pro. Сравните с Claude Max за $100–200. api отдельно: $1.00 за миллион входных токенов и $3.20 за выходные, что в разы дешевле западных гигантов. Если вы прототипируете, экспериментируете, гоняете агентов на повторяющихся задачах - экономию вы точно почувствуете. Особенно когда у Opus в пиковые часы растет латенси и очереди.

Что за схема

Не обязательная часть для простых любителей вайбкодинга. Архитектурно - MoE на 744B параметров с 40B активными на токен, контекст 200K, DeepSeek Sparse Attention для эффективной работы с длинными контекстами. Из необычного и интересного: вся семейка GLM-5 обучена полностью на 100 000 чипах Huawei Ascend 910B, без единого GPU от Nvidia (импортозамещено, получается?). Для тех, кто поднимает свои инстансы - веса открыты под MIT, деплоить можно через vLLM, SGLang. Техрепорт: «GLM-5: from Vibe Coding to Agentic Engineering».

Итог

Если вы кодите на открытых моделях или ищете запасной вариант, когда Claude тормозит, лимиты кончились, или нужна альтернатива без санкционных рисков - GLM-5.1 стоит рассмотреть и протестировать. Не призываю заменить Opus - лишь как модель следующий очереди в вашем рабочем стеке: разница в 2.6 балла от Opus на практике часто не заметна, а по цене разница еще как заметна.

Полезные ссылки:

Надеюсь тебе понравилось. Лучшая благодарность — это твоя подписка на мой Telegram-канал 😊

Читают сейчас

Глава Microsoft объяснил, почему ИИ не обесценит людей

3 часа назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

5 часов назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

5 часов назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

6 часов назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

8 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения