OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков

2 мин
OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков

OpenAI представила набор open source-промптов, которые должны помочь разработчикам создавать ИИ-приложения безопаснее для подростков. Компания предлагает применять их наряду со своей моделью модерации gpt-oss-safeguard, но отмечает, что эти политики можно адаптировать и для других моделей.

Речь идет не о готовом приложении, а о наборе правил, которые помогают заранее задать границы допустимого поведения ИИ. В них затрагиваются темы графического насилия, сексуального контента, опасных челленджей, вредных представлений о теле, романтического или агрессивного ролевого взаимодействия, а также товаров и услуг с возрастными ограничениями.

Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее. 

В OpenAI объясняют, что даже опытным командам сложно перевести общие цели безопасности в точные и рабочие правила. В результате защита часто получается либо непоследовательной, либо слишком размытой, либо, наоборот, чрезмерно жесткой. Новый набор промптов должен дать разработчикам базовый каркас, который можно дорабатывать под свой продукт.

Над этими политиками OpenAI работала вместе с организациями Common Sense Media и everyone.ai. В компании подчеркивают, что это не полноценное решение всех проблем AI safety, а скорее минимальный практический уровень защиты, который можно быстро встроить в продукт.

На фоне растущего внимания к тому, как ИИ взаимодействует с несовершеннолетними, такой шаг выглядит логичным. Особенно для небольших команд, у которых нет собственных ресурсов на разработку сложной системы модерации с нуля.

Читают сейчас

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

1 час назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

2 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

3 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

5 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения

Апдейт Telegram: форматирование ботов и Markdown-файлы

6 часов назад

Апдейт Telegram: форматирование ботов и Markdown-файлы

Telegram опубликовал крупное обновление с десятками новых функций, в том числе с поддержкой мессенджера на смарт-часах, в том числе с Wear OS, а также опциями для ботов, групп и встроенного браузера.