8 апреля 2026, 18:13
Бывший техлид Kling собрал в Alibaba видеомодель, которая порвала лидерборд

Видеомодель HappyHorse-1.0, которую некоторое количество дней назад обнаружили на анонимной видео-арене Artificial Analysis, возглавила лидерборд в категории генерации видео по тексту без аудио с рейтингом Elo 1357 — обойдя прежнего лидера Seedance 2.0 от ByteDance на 84 пункта. В анимации картинки (image-to-video) без звука HappyHorse тоже на первом месте с рейтингом Elo 1402. В категориях со звуком модель держит второе место в text-to-video (1215 против 1220 у Seedance 2.0) и первое — в image-to-video (1160 против 1158).
Разрыв в 84 пункта Elo в ключевой категории — редкая картина: обычно топ-модели видеоарены укладываются в 10–20 пунктов друг от друга. По правилам рейтинга это означает, что HappyHorse выигрывает приблизительно 62 процентов прямых сравнений. Рейтинг Artificial Analysis строится исключительно на слепых пользовательских голосах — человек видит два ролика по одному и тому же промпту, не зная, какая схема их сделала, и выбирает понравившийся. Именно это делает результат сложным для оспаривания: параметры и технические отчеты в формуле не участвуют.
Позднее в сети появился веб-сайт модели: HappyHorse-1.0 построена в подразделении Future Life Lab при Taotian Group — части Alibaba, отвечающей за алгоритмы электронной коммерции. Лабораторию возглавляет Чжан Ди — бывший вице-президент Kuaishou и технический лидер направления Kling AI, один из ключевых людей в китайской видеогенерации. В конце 2025 года он перешел в Taotian, чтобы возглавить новую структуру, и HappyHorse-1.0 стала ее первым публичным результатом. Для Alibaba это означает второе параллельное видео-направление: классическое семейство WAN развивает Tongyi Lab, а команда Чжан Ди работает внутри e-commerce-вертикали и уже обогнала в тесте и свой же WAN 2.6, и главного конкурента ByteDance.
По описанию на сайте, HappyHorse-1.0 — это схема на 15 миллиардов параметров с единым 40-слойным трансформером, где текстовые токены, скрытое представление референс-картинки, видео и аудио денойзятся в одной общей последовательности без перекрестного внимания (cross-attention). Пятисекундный клип в разрешении 256p рендерится приблизительно за 2 секунды на H100, 1080p — за 38 секунд. Команда обещает выложить в опенсорс базовую схема, дистиллят, компонент повышения разрешения и код инференса; ссылки на GitHub и Model Hub пока помечены как "скоро". Если обещание по опенсорсу будет выполнено, HappyHorse-1.0 станет первой моделью с открытыми весами, напрямую обошедшей закрытые коммерческие системы в слепом пользовательском тесте на видео.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

52 минуты назад
Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках
Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

1 час назад
Google отключил оператор inurl
Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

2 часа назад
Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat
13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

4 часа назад
Microsoft выпустила версию PowerToys 0.100.0
Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения

5 часов назад
Апдейт Telegram: форматирование ботов и Markdown-файлы
Telegram опубликовал крупное обновление с десятками новых функций, в том числе с поддержкой мессенджера на смарт-часах, в том числе с Wear OS, а также опциями для ботов, групп и встроенного браузера.