4 часа назад
Свежий курс Практикума PRO: освойте цельный стек обработки аудиоданных

Речевые технологии лежат в основе целого класса продуктов: от голосовых ассистентов и расшифровщиков аудио до сервисов озвучки контента. На курсе «Аудиоанализ, распознавание и генерация речи» от Яндекс Практикума PRO освоите инженерную базу для работы с ними — создадите собственный служба и научитесь обучать и дообучать речевые модели под конкретные задачи.
Курс подойдёт инженерам машинного обучения и тем, кто уже знаком с обработкой естественного языка (NLP).
Что освоите
Работу со звуком. Научитесь превращать аудиосигнал в числовые представления — спектрограммы и частотные признаки — и строить на их основе классификаторы.
Распознавание речи. Пройдёте путь от классических архитектур до современных трансформерных моделей — Whisper и других. Научитесь настраивать декодирование и оценивать качество.
Дообучение под свои задачи. Разберётесь, как адаптировать большие речевые модели — HuBERT и другие — под определённый адрес сайта и информация.
Синтез речи. Соберёте конвейер для обработки аудио. Поработаете с акустической моделью FastSpeech и нейросетевым вокодером HiFi-GAN, научитесь управлять характеристиками голоса.
Оптимизацию и выполнение модели на новых данных (инференс). Экспортируете всё в компактный формат ONNX, ускорите работу на видеокарте и соберёте готовый служба.
Два уровня погружения — под разные цели
Базовый тариф рассчитан на три месяца — освоите стек для обработки аудиоданных, положите четыре проекта в портфолио. Поможет разобраться в технологии и забрать навыки в работу.
Расширенный тариф длится пять месяцев — добавите восемь проектов и глубоко изучите обработку естественного языка (NLP): языковые модели, работу с текстом и интеграцию с речевыми системами. Поможет сменить специализацию и закрепиться в роли.
Как устроено обучение
Нагрузка — приблизительно 10 часов в неделю, учёба разбита на спринты. В каждом есть теория и работа над проектами на облачных машинах с графическими процессорами (GPU).
Учиться можно в любое время, главное — успевать к срокам сдачи, чтобы получить обратную связь от опытных инженеров. Если поймёте, что нужен свой темп, — можно перейти на трек без дедлайнов.
Ближайший старт — 27 августа и 24 сентября. А бесплатный первый компонент можно пройти уже сейчас — освежите базу по нейросетям и посмотрите, как устроена платформа, прежде чем нырять в основное обучение.
Читают сейчас
25 минут назад
Власти и эксперты оценили влияние ИИ на образование и литературную сферу
Технологии искусственного интеллекта всё активнее внедряются в российскую систему образования и уже используются на разных уровнях — от средней до высшей школы. При этом представители образовательного

31 минуту назад
И это ваш AGI? DeepSeek V4 допустил мрачную ошибку в задаче про апельсины и нож
В соцсетях разошелся скрин с ответом DeepSeek V4 на простую головоломку: как поровну разделить четыре одинаковых апельсина между четырьмя детьми, если есть только один нож. На скрине схема выбирает са

48 минут назад
OpenAI, MediaTek и Qualcomm работают над мобильным чипом для ИИ-смартфона
OpenAI сотрудничает с MediaTek и Qualcomm в рамках проекта разработки мобильных процессоров для смартфонов с искусственным интеллектом, поделился аналитик TF International Securities Минг-Чи Куо. По е

1 час назад
У ИИ-подрядчиков Mercor украли 4 ТБ голосовых сэмплов
Группа вымогателей группировки Lapsus$ опубликовала на своём сайте утечек информация компании Mercor, которые включают 4 ТБ голосовых образцов от 40 000 подрядчиков, занимающихся разработкой ИИ. Ознак

1 час назад
Зрителей российских онлайн-кинотеатров стартовали предупреждать о вырезанных из фильмов сценах
Зрителей российских онлайн‑кинотеатров стартовали предупреждать специальными титрами о сокращении хронометража фильмов и сериалов из‑за удаления определённых сцен в соответствии с требованиями законод