
3 часа назад
DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов
Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией. V4-Pro содержит 1,6 триллиона параме