В DeepPavlov добавят модули для борьбы с галлюцинациями и избыточным поиском

2 мин
В DeepPavlov добавят модули для борьбы с галлюцинациями и избыточным поиском

Российская open-source набор модулей DeepPavlov получит обновление с новыми инструментами для работы с искусственным интеллектом. Разработку представили исследователи из МФТИ, MWS AI (входит в «МТС Web Services»), института AIRI, университета ИТМО и AI Talent Hub.

DeepPavlov — это библиотека для создания диалоговых систем и решений в области обработки естественного языка. Она включает готовые модели и инструменты для задач понимания текста, поиска ответов, классификации и анализа тональности, а также может использоваться для построения более сложных сценариев взаимодействия с пользователем.

В новой версии библиотеки появятся три компонента: классификатор токсичности, детектор контекстных галлюцинаций и классификатор evergreen-вопросов — вопросов, ответы на которые не устаревают со временем.

Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.

Детектор галлюцинаций даёт возможность выявлять фрагменты ответа модели, не подтвержденные переданным контекстом, что особенно важно для сценариев с использованием RAG. Классификатор evergreen-вопросов помогает определить, требуется ли для ответа внешний поиск, или модель может обойтись без него. Классификатор токсичности используется для дополнительного контроля безопасности.

Компоненты можно применять как отдельные сервисы, подключать по программный интерфейс и встраивать в production-пайплайны. Разработчики равным образом отмечают поддержку нескольких языков.

Одновременно авторы указывают на ограничения решений. Детектор галлюцинаций работает только с фактологическими ошибками, связанными с контекстом, и не охватывает логические или смысловые неточности. Классификатор токсичности равным образом может работать нестабильно из-за особенностей обучающих данных.

Читают сейчас

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

1 час назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

2 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

3 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

5 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения

Апдейт Telegram: форматирование ботов и Markdown-файлы

6 часов назад

Апдейт Telegram: форматирование ботов и Markdown-файлы

Telegram опубликовал крупное обновление с десятками новых функций, в том числе с поддержкой мессенджера на смарт-часах, в том числе с Wear OS, а также опциями для ботов, групп и встроенного браузера.