8 апреля 2026, 11:40

В DeepPavlov добавят модули для борьбы с галлюцинациями и избыточным поиском

2 мин

Российская open-source набор модулей DeepPavlov получит обновление с новыми инструментами для работы с искусственным интеллектом. Разработку представили исследователи из МФТИ, MWS AI (входит в «МТС Web Services»), института AIRI, университета ИТМО и AI Talent Hub.

DeepPavlov — это библиотека для создания диалоговых систем и решений в области обработки естественного языка. Она включает готовые модели и инструменты для задач понимания текста, поиска ответов, классификации и анализа тональности, а также может использоваться для построения более сложных сценариев взаимодействия с пользователем.

В новой версии библиотеки появятся три компонента: классификатор токсичности, детектор контекстных галлюцинаций и классификатор evergreen-вопросов — вопросов, ответы на которые не устаревают со временем.

Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.

Детектор галлюцинаций даёт возможность выявлять фрагменты ответа модели, не подтвержденные переданным контекстом, что особенно важно для сценариев с использованием RAG. Классификатор evergreen-вопросов помогает определить, требуется ли для ответа внешний поиск, или модель может обойтись без него. Классификатор токсичности используется для дополнительного контроля безопасности.

Компоненты можно применять как отдельные сервисы, подключать по программный интерфейс и встраивать в production-пайплайны. Разработчики равным образом отмечают поддержку нескольких языков.

Одновременно авторы указывают на ограничения решений. Детектор галлюцинаций работает только с фактологическими ошибками, связанными с контекстом, и не охватывает логические или смысловые неточности. Классификатор токсичности равным образом может работать нестабильно из-за особенностей обучающих данных.

DeepPavlov ии NLP LLM RAG open source чат-боты обработка текста галлюцинации токсичность

Читают сейчас

56 минут назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

2 часа назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

3 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

4 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

6 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения