5 часов назад
DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов

Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией.
V4-Pro содержит 1,6 триллиона параметров. Контекстное окно — один миллион токенов. Одновременно модель потребляет приблизительно 27% вычислений от того, что требовалось предшественнику DeepSeek-V3 при аналогичном контексте.
V4-Flash меньше — 284 миллиарда параметров с 13 активными — и ещё экономичнее: около 10% FLOPs и 7% KV-cache относительно V3. Контекст тот же — миллион токенов.
Обе модели поддерживают три режима рассуждения: Non-think для быстрых задач, Think High и Think Max для сложного планирования. По заявлению разработчиков, Flash в режиме Think Max по ряду задач приближается к Pro.

На агентных кодинг-бенчмарках V4-Pro конкурирует с Claude Opus 4.6 и Sonnet 4.5. На Codeforces рейтинг модели — около 3206. В задачах на знание мира чуть уступает Gemini Pro 3.1.
Цены на api: V4-Flash — $0,14 за миллион входных токенов, V4-Pro — $1,74. Для сравнения, топовые закрытые модели стоят в разы дороже. Есть ночная скидка 50% по пекинскому времени.
Мультимодальность пока отсутствует — сопровождение изображений и видео анонсирована на вторую половину 2026 года. Модели обучены на около 32 триллионах токенов и оптимизированы под чипы Huawei Ascend.
Доступно уже сейчас: чат DeepSeek, OpenRouter, Hugging Face.
Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!
Читают сейчас

39 минут назад
OpenAI выпустила ChatGPT для врачей
Организация OpenAI представила версию ассистента ChatGPT for Clinicians, построенную на базе GPT-5.4 и адаптированную под медицинские задачи. Читать далее

51 минуту назад
На космодроме Куру в Гвианском космическом центре взорвана мобильная башня обслуживания для ракеты-носителя «Союз-СТ»
23 августа 2026 года в Гвианском космическом центре на бывшем стартовом комплексе российской ракеты-носителя «Союз-СТ» была взорвана мобильная башня обслуживания. До этого на самой пусковой установке

1 час назад
xAI выпустила флагманскую голосовую схема для реального общения
Компания xAI открыла api-доступ к новой модели grok-voice-think-fast-1.0, ориентированной на клиентский служба и телемаркетинг. Ключевая особенность — полноценный дуплексный режим: модель умеет вести

1 час назад
«ВКонтакте» расширила «VK Донат» на личные страницы
«ВКонтакте» добавила в личные профили функция подключить «VK Донат» и зарабатывать на эксклюзивном контенте. Ранее такая возможность была доступна только в сообществах. Ознакомиться далее

1 час назад
Увеличение числа дата-центров в США помогает продлевать сроки эксплуатации угольных электростанций
Увеличение числа центров обработки данных в США способствует продлению сроков эксплуатации угольных электростанций, замедляет переход к более чистой энергосистеме и усугубляет загрязнение воздуха. Об