19 мая 2026, 22:23

Вышла видеомодель Google Gemini Omni: «превратит что угодно во что угодно»

2 мин

Google 19 мая на конференции I/O 2026 представила Gemini Omni Flash — первую модель нового семейства Omni, способную не просто генерировать видео, а переделывать уже снятый ролик по текстовым командам прямо в чате. Анонс делал глава Google DeepMind Демис Хассабис. Схема раскатывается сразу: всем подписчикам тарифов Google AI Plus, Pro и Ultra по всему миру через приложение Gemini и киноинструмент Flow, а в YouTube Shorts и приложении YouTube Create — бесплатно, в течение недели.

Главное отличие от прошлогодней Veo — направление работы. Veo превращала текст в видео с нуля, Omni берет любой ввод (текст, изображения, аудио или готовое видео) и меняет в нем то, что нужно: персонажей, объекты, происходящее в кадре. Редактирование идет цепочкой — каждая следующая команда опирается на предыдущую, одновременно персонажи остаются прежними, а сцена "помнит", что было до этого. Отдельно Google делает упор на физику: организация заявляет, что модель точнее обращается с гравитацией, динамикой жидкостей и кинетической энергией, поэтому из короткого промпта можно собрать, например, наглядный научный ролик — на презентации показывали пластилиновый ролик про сворачивание белка.

В Google подумали о безопасности. Каждое видео получает незаметный цифровой водяной знак SynthID, и его происхождение можно проверить через программа Gemini, через Gemini в браузере Chrome и в поиске Google. Вставить в ролик можно собственный аватар — внешность и голос самого пользователя, — но менять чужую речь и звук схема на старте не дает: эту способность придержали, пока не придумают, как раздать ее безопасно. Логика понятна — без таких рамок Omni превращается в готовую фабрику дипфейков.

Это только начало семейства. Google уже анонсировала старшую модель Omni Pro (детали обещают позже) и говорит, что со временем Omni научится выдавать не только видео, но и изображения со звуком. Ставка тут шире одной модели: Google пытается стать единой точкой генерации контента с готовой раздачей через YouTube, поиск и собственные приложения — особенно с учетом того, что OpenAI заморозила направление видеогенерации Sora..

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Google Gemini Gemini Omni

Читают сейчас

30 минут назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

2 часа назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

3 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

3 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

6 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения