13 марта 2026, 18:27
Avito Data Quest: как корпоративный выезд стал игрой для всех желающих

Привет, ! Меня зовут Михаил Каменщиков, я руковожу командой Рекомендаций в Авито. Хочу рассказать про штуку, которую мы придумали на выезде — и которая в результате переросла во что-то большее, чем внутренняя шутка команды.
У DS в Авито есть традиция: раз в год мы выбираемся за город, отключаемся от рабочих проектов и делаем что-нибудь совершенно не похожее на обычный день. В тот раз был отель, живая музыка и — неожиданно — долгие разговоры за кофе о том, как объяснить людям вне профессии, чем мы вообще занимаемся.

Потому что объяснять это — правда сложно.
«Ну ты типа в экселе считаешь?»
Каждый DS хоть раз слышал что-то подобное. И каждый раз пытается найти слова.
Хотя, если подумать — наши задачи сами по себе звучат как хорошие истории. Вот несколько примеров из жизни команды Авито.
Мы обучили ML-модель распознавать «договорённости» между продавцами и покупателями в чатах — без данных о реальных сделках. Почему это сложно? Потому что «договоренность» — абстракция: одни пишут «встретимся в пять», другие — «может, подъеду, не знаю». Пришлось собрать вместе бизнес, аналитиков и дата-сайентистов, написать инструкцию, разметить данные вручную, итеративно устранять серые зоны — и в результате получить метрику, которую теперь используют в целеполагании всей компании и A/B-тестах.
Или вот: главная веб-страница Авито — это бесконечная персональная лента объявлений, через которую проходит около 50% всех просмотров и 30% контактов покупателей с продавцами. Казалось бы, просто покажи самое релевантное — и дело сделано. Но если схема ранжирует объявления независимо, она показывает пять одинаковых айфонов подряд. Мы сделали блендер на основе трансформерной модели интересов пользователя — и получили +2,5% пользователей, дошедших до контакта с продавцом. На масштабах Авито это сотни тысяч дополнительных покупателей в сутки.
А ещё у нас есть внутренний BI-инструмент М42 с более чем 16 000 бизнес-метрик. Поиск нужной метрики вручную — боль. Мы встроили ИИ-ассистент на основе RAG и LLM: один из пользователей написал: «ИИ-ассистент нашёл информация с первого запроса. Я их несколько месяцев назад искал почти час. Фантастика!» Построение графиков стало быстрее в два раза.

Вот чем практически занимаются дата-сайентисты: детективные расследования в данных, поиск сигнала в шуме, объяснение абстракций через цифры — и постоянный баланс между «работает в теории» и «работает в проде».
Игровой подход работает — и мы знаем это на собственном опыте
На том же выезде гвоздём программы был хакатон по управлению беспилотными автомобилями, реализованный с помощью симулятора CARLA. Звучит как «опять дедлайны» — и да, поначалу скепсис был. «Мы и так целый год обучали модели, дайте просто отдохнуть», — думал каждый второй.
Но сработало идеально. Задача вне домена Авито, команды из разных отделов, которые в обычной жизни пересекаются редко, — и вдруг за кофе-брейком обсуждаешь не задачи поиска, а почему твоя машина в симуляторе устраивает токийский дрифт вместо того, чтобы ехать по полосе.

Вот тогда и стало окончательно понятно: игровой формат — это не «несерьёзно». Это просто иной способ думать о сложном.
Так появился Avito Data Quest

Мы взяли повседневные задачи DS-специалистов и упаковали их в интерактивный квест. Три блока:
— базовый ML и Python — можно ли с вами разговаривать на одном языке?
— ситуативные задачи — здесь нужны опыт и интуиция, хотя иногда хватает смекалки;
— Марио — Data Scientist — да, тот самый Марио, только теперь он аналитик данных и бежит по офису Авито. Можно заработать подсказку 50 на 50.
После трёх блоков — выбор направления и хардовые вопросы по нему. Новейший кейс мы намеренно сделали нетривиальным: это то, что заставляет по-настоящему думать, а не просто вспоминать.
Небольшой честный спойлер: часть вопросов мы используем на реальных собеседованиях. Так что это не просто квиз — это что-то вроде демо-режима перед интервью, только без стресса и галстука.
Почему именно Марио — отдельный разговор

Потому что мы его любим. Но раз уж вы айтишники — вот факт, который всё объясняет: оригинальная игра помещалась на картридже объемом 40 килобайт (32 КБ на код, 8 КБ на графику). Это меньше, чем весит средняя иконка приложения. Одновременно — более чем 50 миллионов проданных копий, а вся серия вплотную подходит к отметке 1 миллиард.
Красивое инженерное подход в контексте жёстких ограничений. Звучит знакомо?
Что в итоге

Пять победителей получат мерч AvitoTech. Подведение итогов — 20 марта.
Но честно: мы запомним не только победителей. Нетривиальное мышление и неожиданный ход — это именно то, за чем мы вообще следим. Немедленный оффер не обещаем. Хотя, как представил наш выезд, из спонтанных идей иногда вырастает кое-что интересное.
→ Попробовать Avito Data Quest
Читают сейчас

9 минут назад
Разработчик Amazon выявил регрессию в тестовом ядре Linux 7.0, в два раза снижающую эффективность PostgreSQL
Разработчик из Amazon Сальваторе Дипьетро обнаружил регрессию при тестировании СУБД PostgreSQL и компонентов готовившегося к релизу ядра Linux 7.0. Выпуск новой версии ядра Linux, которая будет исполь

1 час назад
Экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны
В НАСА сообщили, что экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны. В настоящий момент корабль находится приблизительно в 141 тыс. км от Луны

1 час назад
Представлен публике дистрибутив Netrunner 26 на Debian 13 «Trixie» и Linux 6.16
В начале апреля 2026 года разработчик проекта Nitrux Ури Эррера объявил о выпуске и общедоступности сборки Netrunner 26 (кодовое название Twilight), спустя более года после выхода Netrunner 25. Инициа

2 часа назад
Версия библиотеки meshoptimizer 1.1
2 апреля 2026 года разработчик Arseny Kapoulkine (zeux) представил обновление открытой библиотеки meshoptimizer 1.1. Исходный исходник проекта написан на C++ и JavaScript и опубликован на GitHub под л

8 часов назад
Claude Code нашел 23-летний дефект в Linux
Николас Карлини, исследователь из Anthropic, рассказал на конференции [un]prompted 2026, что с помощью Claude Code обнаружил несколько удаленно эксплуатируемых уязвимостей в ядре Linux. Одна из них —