13 марта 2026, 19:43
В МФТИ обучили RL-агента управлять складскими запасами ритейла

Исследователи Института искусственного интеллекта МФТИ разработали систему управления складскими запасами на основе обучения с подкреплением (reinforcement learning). В тестировании на исторических данных крупного дистрибьютора механизм увеличил валовую прибыль на 7% и повысил долю удовлетворённого спроса с 80% до 90%.
Управление запасами — одна из самых сложных задач логистики, особенно когда речь идёт о десятках тысяч товарных позиций и нестабильном спросе. Большинство существующих систем автозаказа, в том числе решения SAP, Oracle и RELEX, работают по схеме «прогноз + правило»: сначала прогнозируется спрос, затем применяется заранее заданная формула для расчёта заказа.
Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.
Разработка МФТИ использует другой решение. RL-агент принимает решения напрямую на основе целевой бизнес-метрики — например, прибыли или уровня удовлетворённого спроса. Механизм учитывает долгосрочные последствия каждого заказа и адаптируется к изменениям спроса и логистических параметров без ручной перенастройки правил.
Для обучения разработчики создали цифровую схема бизнес-процессов склада — платформу, которая воспроизводит историю продаж и позволяет тестировать различные стратегии управления запасами. На этой модели обучается нейросеть с оригинальной архитектурой: она управляет каждой парой «товар – склад» автономно, но использует опыт, накопленный по всей номенклатуре товаров.
Обучение прототипа на выборке из 10 тысяч пар «товар – склад» занимает менее суток на стандартном серверном оборудовании.
Второй этап проекта — валидация на новых данных заказчика за 2025 год. После этого систему планируют интегрировать в существующие ERP-решения, в том числе «1С». На первом этапе она будет функционировать как рекомендательная система, а затем может перейти к целиком автоматическому управлению закупками.
По оценкам разработчиков, потенциальный экономический эффект для крупных компаний может составлять десятки миллионов рублей в год.
Техника может применяться в ритейле, автосервисе, дистрибуции промышленного оборудования и электроники — везде, где требуется управлять большим ассортиментом товаров и быстро реагировать на модификация спроса.
Читают сейчас

10 минут назад
Разработчик Amazon выявил регрессию в тестовом ядре Linux 7.0, в два раза снижающую эффективность PostgreSQL
Разработчик из Amazon Сальваторе Дипьетро обнаружил регрессию при тестировании СУБД PostgreSQL и компонентов готовившегося к релизу ядра Linux 7.0. Выпуск новой версии ядра Linux, которая будет исполь

1 час назад
Экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны
В НАСА сообщили, что экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны. В настоящий момент корабль находится приблизительно в 141 тыс. км от Луны

1 час назад
Представлен публике дистрибутив Netrunner 26 на Debian 13 «Trixie» и Linux 6.16
В начале апреля 2026 года разработчик проекта Nitrux Ури Эррера объявил о выпуске и общедоступности сборки Netrunner 26 (кодовое название Twilight), спустя более года после выхода Netrunner 25. Инициа

2 часа назад
Версия библиотеки meshoptimizer 1.1
2 апреля 2026 года разработчик Arseny Kapoulkine (zeux) представил обновление открытой библиотеки meshoptimizer 1.1. Исходный исходник проекта написан на C++ и JavaScript и опубликован на GitHub под л

8 часов назад
Claude Code нашел 23-летний дефект в Linux
Николас Карлини, исследователь из Anthropic, рассказал на конференции [un]prompted 2026, что с помощью Claude Code обнаружил несколько удаленно эксплуатируемых уязвимостей в ядре Linux. Одна из них —