Бывший техлид Kling собрал в Alibaba видеомодель, которая порвала лидерборд

2 мин
Бывший техлид Kling собрал в Alibaba видеомодель, которая порвала лидерборд

Видеомодель HappyHorse-1.0, которую некоторое количество дней назад обнаружили на анонимной видео-арене Artificial Analysis, возглавила лидерборд в категории генерации видео по тексту без аудио с рейтингом Elo 1357 — обойдя прежнего лидера Seedance 2.0 от ByteDance на 84 пункта. В анимации картинки (image-to-video) без звука HappyHorse тоже на первом месте с рейтингом Elo 1402. В категориях со звуком модель держит второе место в text-to-video (1215 против 1220 у Seedance 2.0) и первое — в image-to-video (1160 против 1158).

Разрыв в 84 пункта Elo в ключевой категории — редкая картина: обычно топ-модели видеоарены укладываются в 10–20 пунктов друг от друга. По правилам рейтинга это означает, что HappyHorse выигрывает приблизительно 62 процентов прямых сравнений. Рейтинг Artificial Analysis строится исключительно на слепых пользовательских голосах — человек видит два ролика по одному и тому же промпту, не зная, какая схема их сделала, и выбирает понравившийся. Именно это делает результат сложным для оспаривания: параметры и технические отчеты в формуле не участвуют.

Позднее в сети появился веб-сайт модели: HappyHorse-1.0 построена в подразделении Future Life Lab при Taotian Group — части Alibaba, отвечающей за алгоритмы электронной коммерции. Лабораторию возглавляет Чжан Ди — бывший вице-президент Kuaishou и технический лидер направления Kling AI, один из ключевых людей в китайской видеогенерации. В конце 2025 года он перешел в Taotian, чтобы возглавить новую структуру, и HappyHorse-1.0 стала ее первым публичным результатом. Для Alibaba это означает второе параллельное видео-направление: классическое семейство WAN развивает Tongyi Lab, а команда Чжан Ди работает внутри e-commerce-вертикали и уже обогнала в тесте и свой же WAN 2.6, и главного конкурента ByteDance.

По описанию на сайте, HappyHorse-1.0 — это схема на 15 миллиардов параметров с единым 40-слойным трансформером, где текстовые токены, скрытое представление референс-картинки, видео и аудио денойзятся в одной общей последовательности без перекрестного внимания (cross-attention). Пятисекундный клип в разрешении 256p рендерится приблизительно за 2 секунды на H100, 1080p — за 38 секунд. Команда обещает выложить в опенсорс базовую схема, дистиллят, компонент повышения разрешения и код инференса; ссылки на GitHub и Model Hub пока помечены как "скоро". Если обещание по опенсорсу будет выполнено, HappyHorse-1.0 станет первой моделью с открытыми весами, напрямую обошедшей закрытые коммерческие системы в слепом пользовательском тесте на видео.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

«Октава ДМ» представила российскую дискуссионную систему OCS-80

28 минут назад

«Октава ДМ» представила российскую дискуссионную систему OCS-80

Организация «Октава ДМ» разработала дискуссионную систему OCS-80. Подход предназначено для оснащения залов официальных заседаний, судебных органов и переговорных пространств. Платформа сочетает в себе

Российский WCS Automacon: диспетчер для роботов на складе уже не «софт», а «железобетон»

43 минуты назад

Российский WCS Automacon: диспетчер для роботов на складе уже не «софт», а «железобетон»

ГК «Автомакон» выводит на сегмент платформу управления складской логистикой. Под капотом Go, React и цифровой двойник. Рассказываем, почему это не очередной MVP, и кто уже управляет 80+ роботами в реа

Meta* представила ИИ Muse Spark: первая схема новой Superintelligence Labs после провала Llama 4

48 минут назад

Meta* представила ИИ Muse Spark: первая схема новой Superintelligence Labs после провала Llama 4

Meta Superintelligence Labs (MSL, принадлежит Meta*, компании, признанной экстремистской и запрещенной в РФ) представила Muse Spark — нативно мультимодальную reasoning-модель с поддержкой вызова инстр

Система Cozystack (CNSF Sandbox) обзавелась публичными страничками с опенсорсной аналитикой

51 минуту назад

Система Cozystack (CNSF Sandbox) обзавелась публичными страничками с опенсорсной аналитикой

Мы запустили на сайте Cozystack новый раздел с open source-статистикой по проекту. Он обновляется автоматически раз в месяц. Читать далее

ИИ-энергосеть под ИИ отключает свет беднякам — MIT научился это находить

1 час назад

ИИ-энергосеть под ИИ отключает свет беднякам — MIT научился это находить

Представьте автономную ИИ-систему, которая управляет городской энергосетью: она минимизирует издержки, держит напряжение стабильным и выглядит идеально по всем техническим метрикам. А потом выясняется