DeepSeek V4 уже доступен бесплатно в чат-приложении — 1М контекста и приличные бенчмарки

2 мин
DeepSeek V4 уже доступен бесплатно в чат-приложении — 1М контекста и приличные бенчмарки

DeepSeek выпустила V4 Preview: веса выложены на Hugging Face, платный доступ организован через api, а в веб-чате и приложениях схема можно попробовать бесплатно. В линейку входят две модели на архитектуре "смесь экспертов": DeepSeek-V4-Pro с 1,6 трлн параметров, из которых активируются 49 млрд, и DeepSeek-V4-Flash с 284 млрд параметров и 13 млрд активных. В чате это flash и expert соответственно. Обе версии работают в быстром режиме и режиме глубокого мышления и поддерживают веб-поиск.

Контекстное окно обеих моделей до 1 млн токенов, а в программный интерфейс у них заявлен максимальный вывод до 384K токенов, вызовы инструментов и JSON-вывод. В карточке на Hugging Face веса опубликованы под MIT-лицензией, так что корректнее говорить об открытых весах, а не о целиком открытом процессе обучения. Бенчмарки близки к моделям-лидерам прошлого поколения, вроде Opus 4.6 и GPT-5.4. А вот свежим Opus 4.7 и только что вышедшей GPT-5.5 новинка все-таки уступает:

Технически основной акцент V4 — экономия на длинном контексте. DeepSeek пишет, что при контексте в 1 млн токенов V4-Pro требует только 27% вычислений на новый токен и 10% KV-кеша по сравнению с DeepSeek-V3.2. KV-кеш — это хранилище, где модель хранит промежуточные данные внимания; именно она быстро разрастается на длинных запросах. Следовательно здесь важен не только сам миллион токенов, но и попытка сделать такой режим дешевле в реальной эксплуатации.

Для разработчиков DeepSeek отдельно продвигает V4 как схема для кодинг-агентов. В документации есть инструкция для подключения к Claude Code через Anthropic-совместимый программный оболочку: V4-Pro предлагается использовать как схема уровня Opus/Sonnet, а V4-Flash — как более оперативный и дешевый вариант уровня Haiku. Это не нативная сопровождение Claude Code со стороны Anthropic, а совместимый endpoint, но направление видно: DeepSeek хочет попасть в инструмент, которым пользуются профессионалы по своему миру. А для массового пользователя предлагает бесплатный чат-вариант.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Глава Microsoft объяснил, почему ИИ не обесценит людей

1 час назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

3 часа назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

4 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

5 часов назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

7 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения