Microsoft опенсорснула RAMPART — каркас безопасности ИИ-агентов

2 мин
Microsoft опенсорснула RAMPART — каркас безопасности ИИ-агентов

Microsoft выложила в публичный доступ два инструмента для разработчиков ИИ-агентов — RAMPART и Clarity. Первый встраивает тестирование безопасности прямо в CI-пайплайн, следующий помогает продумать архитектуру до написания кода. Оба проекта доступны на GitHub.

RAMPART — это каркас для написания тестов безопасности в формате обычных pytest-сценариев. Он построен поверх PyRIT, открытой платформы Microsoft для проверки генеративных моделей. Логика простая: разработчик описывает скрипт угрозы из своей модели рисков, каркас подключается к агенту, прогоняет взаимодействие и выдает результат — пройдено или нет. Тесты встают в CI рядом с обычными интеграционными и блокируют сборку при провале. Внедрил агенту новый инструмент или источник данных — добавь проверка на безопасность в том же пулл-реквесте.

Главный фокус RAMPART сейчас — атаки через добавление промптов (prompt injection), когда агент получает вредоносные инструкции не от пользователя, а из обрабатываемых данных: писем, тикетов, документов. Каркас умеет работать с вероятностной природой языковых моделей: один и тот же проверка можно прогнать некоторое количество раз и задать порог — например, "действие должно быть безопасным минимум в 80% запусков". Это ближе к реальному поведению агентов в продакшене, чем разовая тест.

Clarity устроен иначе — это не про тестирование, а про проектирование. Средство работает как собеседник, который задает вопросы, которые обычно задают опытные архитекторы и специалисты по безопасности. В частности, команда хочет добавить совместное редактирование в документ — Clarity спросит, что произойдет, если два человека одновременно редактируют один абзац. Результаты сохраняются в директории .clarity-protocol/ внутри репозитория как обычный markdown — их можно коммитить, ревьюить и диффить вместе с кодом. Несколько ИИ-"аналитиков" независимо проверяют систему с разных сторон: защита, человеческий фактор, операционные риски.

Microsoft позиционирует оба инструмента как часть подхода, в котором защита ИИ — это не разовый аудит, а непрерывная инженерная дисциплина. Clarity фиксирует решения и допущения на старте, RAMPART превращает результаты ред-тиминга и инциденты в регрессионные тесты, которые живут столько же, сколько сам инициатива.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

16 минут назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

1 час назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

1 час назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

4 часа назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения

Апдейт Telegram: форматирование ботов и Markdown-файлы

4 часа назад

Апдейт Telegram: форматирование ботов и Markdown-файлы

Telegram опубликовал крупное обновление с десятками новых функций, в том числе с поддержкой мессенджера на смарт-часах, в том числе с Wear OS, а также опциями для ботов, групп и встроенного браузера.