26 марта 2026, 19:40
Gemini 3.1 Flash Live — голосовой ИИ со скоростью живого диалога

Google выпустила Gemini 3.1 Flash Live — модель, специально созданную для голосовых и визуальных агентов, работающих в реальном времени. Модель доступна в превью через Live api в Google AI Studio. По заявлению компании, она обеспечивает качественный скачок по задержке, надежности и естественности диалога относительно предыдущей 2.5 Flash Native Audio.
Ключевая особенность — устойчивость в шумной среде. Модель научилась отделять голос пользователя от фоновых звуков вроде телевизора или уличного движения и надежно выполнять инструкции даже при непредсказуемых поворотах разговора. В дополнение к этого, Flash Live поддерживает более 90 языков для мультимодальных диалогов в реальном времени и лучше распознаёт акустические нюансы — интонацию, темп, ударения.
Несколько компаний уже интегрировали схема в свои продукты. Дизайн-инструмент Stitch от Google позволяет управлять интерфейсом голосом — агент видит холст и может критиковать макеты или предлагать вариации. Устройство-компаньон Ato использует мультиязычные возможности модели для общения с пожилыми людьми. А студия Weekend встроила Flash Live в мастера подземелий своей RPG Wit's End — для театральной подачи реплик в реальном времени.
Релиз продолжает стратегию Google по фрагментации линейки Gemini под конкретные задачи: Flash-Lite — для дешевых массовых конвейеров, Flash — для баланса скорости и качества, а теперь Flash Live — для голосовых агентов, где критична минимальная задержка и натуральность диалога.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

1 час назад
Глава Microsoft объяснил, почему ИИ не обесценит людей
Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

3 часа назад
Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках
Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

3 часа назад
Google отключил оператор inurl
Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

4 часа назад
Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat
13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

7 часов назад
Microsoft выпустила версию PowerToys 0.100.0
Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения