DeepSeek дообучили без Nvidia: 1000 Ascend 910C и 1500 итераций без сбоев

2 мин
DeepSeek дообучили без Nvidia: 1000 Ascend 910C и 1500 итераций без сбоев

Исследовательская команда во главе с Huawei провела полное дообучение (full-parameter post-training) модели DeepSeek V4-Pro на 1,6 трлн параметров, используя кластер минимум из 1000 ускорителей Ascend 910C. Об этом 5 июня сообщило в соцсетях правительство Шэньчжэня, на пост обратила внимание South China Morning Post. По данным команды, прогон занял свыше 1500 итераций обучения и прошел без единого сбоя, а математические способности модели в итоге улучшились.

Вместе с Huawei над проектом работали шэньчжэньский кампус Харбинского политехнического института, Шэньчжэньский институт больших данных и Shenzhen Loop Area Institute. Ключевое слово здесь — "полное": как уточняет Tom's Hardware, при дообучении обновлялись все 1,6 трлн весов модели, а не легкая надстройка-адаптер поверх замороженной основы.

Контраст с недавним прошлым показательный. В августе 2025 года источники Financial Times рассказывали, что DeepSeek не смогла завершить ни одного успешного прогона обучения модели R2 на Ascend — даже с командой инженеров Huawei, работавшей прямо в офисе компании. Тогда жаловались на нестабильную эффективность, медленные интерконнекты между чипами и сырой программный стек CANN, аналог CUDA. Обучение в итоге вернули на Nvidia, а Ascend оставили под инференс (запускание готовой модели). Вышедшая в апреле V4 стала первой моделью DeepSeek, изначально спроектированной под чипы Huawei.

При этом к заявлению стоит относиться осторожно. В отчете нет бенчмарков, длительности прогона, сравнения с той же задачей на оборудовании Nvidia и данных о том, насколько эффективно использовался кластер. Ресурс — официальный канал городских властей, независимых подтверждений пока нет. И важно не путать масштабы: речь о дообучении, а не о предобучении с нуля. Где проходило предобучение V4-Pro, не раскрывается.

Тренировочные мощности — главная зависимость китайской ИИ-отрасли от Nvidia в условиях американских экспортных ограничений. Ascend 910C — нынешний флагман Huawei: двухкристальный ускоритель, который в ранних тестах DeepSeek показывал приблизительно 60% производительности Nvidia H100 на инференсе. Если результат подтвердится независимыми прогонами, следующая планка очевидна — полное предобучение фронтирной модели на китайском железе. За этим и стоит следить.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

40 минут назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

1 час назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

2 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

4 часа назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения

Апдейт Telegram: форматирование ботов и Markdown-файлы

5 часов назад

Апдейт Telegram: форматирование ботов и Markdown-файлы

Telegram опубликовал крупное обновление с десятками новых функций, в том числе с поддержкой мессенджера на смарт-часах, в том числе с Wear OS, а также опциями для ботов, групп и встроенного браузера.