DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов

2 мин
DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов

Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией.

V4-Pro содержит 1,6 триллиона параметров. Контекстное окно — один миллион токенов. Одновременно модель потребляет приблизительно 27% вычислений от того, что требовалось предшественнику DeepSeek-V3 при аналогичном контексте.

V4-Flash меньше — 284 миллиарда параметров с 13 активными — и ещё экономичнее: около 10% FLOPs и 7% KV-cache относительно V3. Контекст тот же — миллион токенов.

Обе модели поддерживают три режима рассуждения: Non-think для быстрых задач, Think High и Think Max для сложного планирования. По заявлению разработчиков, Flash в режиме Think Max по ряду задач приближается к Pro.

На агентных кодинг-бенчмарках V4-Pro конкурирует с Claude Opus 4.6 и Sonnet 4.5. На Codeforces рейтинг модели — около 3206. В задачах на знание мира чуть уступает Gemini Pro 3.1.

Цены на api: V4-Flash — $0,14 за миллион входных токенов, V4-Pro — $1,74. Для сравнения, топовые закрытые модели стоят в разы дороже. Есть ночная скидка 50% по пекинскому времени.

Мультимодальность пока отсутствует — сопровождение изображений и видео анонсирована на вторую половину 2026 года. Модели обучены на около 32 триллионах токенов и оптимизированы под чипы Huawei Ascend.

Доступно уже сейчас: чат DeepSeek, OpenRouter, Hugging Face.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

OpenAI выпустила ChatGPT для врачей

39 минут назад

OpenAI выпустила ChatGPT для врачей

Организация OpenAI представила версию ассистента ChatGPT for Clinicians, построенную на базе GPT-5.4 и адаптированную под медицинские задачи. Читать далее

На космодроме Куру в Гвианском космическом центре взорвана мобильная башня обслуживания для ракеты-носителя «Союз-СТ»

51 минуту назад

На космодроме Куру в Гвианском космическом центре взорвана мобильная башня обслуживания для ракеты-носителя «Союз-СТ»

23 августа 2026 года в Гвианском космическом центре на бывшем стартовом комплексе российской ракеты-носителя «Союз-СТ» была взорвана мобильная башня обслуживания. До этого на самой пусковой установке

xAI выпустила флагманскую голосовую схема для реального общения

1 час назад

xAI выпустила флагманскую голосовую схема для реального общения

Компания xAI открыла api-доступ к новой модели grok-voice-think-fast-1.0, ориентированной на клиентский служба и телемаркетинг. Ключевая особенность — полноценный дуплексный режим: модель умеет вести

«ВКонтакте» расширила «VK Донат» на личные страницы

1 час назад

«ВКонтакте» расширила «VK Донат» на личные страницы

«ВКонтакте» добавила в личные профили функция подключить «VK Донат» и зарабатывать на эксклюзивном контенте. Ранее такая возможность была доступна только в сообществах. Ознакомиться далее

Увеличение числа дата-центров в США помогает продлевать сроки эксплуатации угольных электростанций

1 час назад

Увеличение числа дата-центров в США помогает продлевать сроки эксплуатации угольных электростанций

Увеличение числа центров обработки данных в США способствует продлению сроков эксплуатации угольных электростанций, замедляет переход к более чистой энергосистеме и усугубляет загрязнение воздуха. Об