27 марта 2026, 19:15
Cohere выпустила открытую схема распознавания речи Transcribe

Компания Cohere представила схема Cohere Transcribe — систему автоматического распознавания речи (ASR), обученную с нуля на 14 языках. Модель построена на архитектуре Conformer и насчитывает приблизительно 2 млрд параметров, что позволяет ей эффективно функционировать в сложных акустических условиях.

Transcribe справляется с задачами, которые традиционно считаются сложными для ASR: распознаёт речь при наличии фонового шума, корректно обрабатывает перекрывающиеся голоса и учитывает особенности акцентов. Это делает модель пригодной для использования в реальных сценариях, таких как звонки, интервью и многоголосые обсуждения.

По данным Cohere, схема показала рекордную точность и заняла первое место в рейтинге Hugging Face Open ASR Leaderboard. Для английского языка метрика WER составил всего 5.42 процентов, что позволило обойти такие решения, как Whisper Large v3 от OpenAI, ElevenLabs Scribe v2 и Qwen3-ASR.
Развернуть схема можно как локально, так и на edge-устройствах, либо применять через api и платформу Cohere Model Vault. Веса уже доступны на Hugging Face, что делает Transcribe одним из самых доступных и мощных open-source решений в сегменте распознавания речи.
Запускание модели подтверждает усиливающуюся конкуренцию в области ASR и тенденция на открытые решения, которые по качеству начинают обгонять закрытые модели крупных компаний.
Читают сейчас
5 минут назад
Как посчитать, приносит ИИ пользу или нет?
До сих пор оценка эффективности нейросетей и ML-моделей в бизнесе часто напоминала гадание. Команды хвастались «высокой точностью модели», а финдиректора разводили руками, не понимая, где реальные ден

50 минут назад
Мертвый интернет ожил? DeepSeek подключили к World of Warcraft серверу с 1800 ботами
Энтузиаст поднял частный хост World of Warcraft эпохи Wrath of the Lich King и заселил его около 1800 ботами, чат которых обрабатывает DeepSeek. Итог он представил на Reddit — это маленький любительск

54 минуты назад
AI Hardcore Set: MCP, агенты и защита GenAI — офлайн-встреча в Авито
11 июля в московском офисе Авито (Лесная, 7) пройдёт AI Hardcore Set — встреча для тех, кто уже работает с MCP и агентами в проде, а не только читает об этом. Четыре доклада без записи — про Spec-Driv

1 час назад
Эффект AirPods: гарнитура сильно меняют то, как люди взаимодействуют друг с другом в обществе
Журналист Маркхэм Хейд в колонке рассказал про «эффект AirPods» — привычку постоянно носить беспроводные гарнитура, что делает людей менее доступными для случайных разговоров. Всё чаще пользователи сп

1 час назад
К2Тех перевел 7500 пользователей крупной газовой компании с Microsoft Exchange на VK WorkSpace
ИТ-компания К2Тех реализовала проект по миграции 7 500 пользователей компании из газовой отрасли с Microsoft Exchange на отечественную почтовую систему VK WorkSpace. Проект был выполнен в режиме высок