16 апреля 2026, 15:48
Google DeepMind выпустила Gemini 3.1 Flash TTS с управлением голосом через текст

Google DeepMind представила новую модель синтеза речи — Gemini 3.1 Flash TTS, сделав акцент на управляемости и гибкости генерации.
Главная фишка — Audio Tags. Это текстовые команды прямо внутри промпта, с помощью которых можно задавать стиль, эмоцию, темп и подачу речи. По сути, пользователь не просто генерирует голос, а «режиссирует» озвучку через текст.

Помимо этого, модель получила:
• более естественное и плавное звучание
• поддержку 70+ языков, в том числе русский
• встроенную маркировку аудио через SynthID, чтобы отличать синтезированную речь от реальной
По качеству схема сразу вошла в топ: на бенчмарке Artificial Analysis TTS Arena она заняла 2-е место с Elo-рейтингом 1211, уступив только Inworld TTS 1.5 Max и обогнав ElevenLabs v3.
Доступ к Gemini 3.1 Flash TTS уже открыт в формате preview через Gemini api и Google AI Studio, для бизнеса — через Vertex AI. В ближайшее время модель равным образом появится в пользовательских продуктах вроде Google Vids.
Это ещё один шаг к тому, чтобы голос в ИИ стал не просто функцией, а полноценным инструментом управления — почти как работа с актёром, только через промпт.
Читают сейчас

58 минут назад
Глава Microsoft объяснил, почему ИИ не обесценит людей
Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

2 часа назад
Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках
Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

3 часа назад
Google отключил оператор inurl
Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

4 часа назад
Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat
13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

6 часов назад
Microsoft выпустила версию PowerToys 0.100.0
Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения