OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков

2 мин
OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков

OpenAI представила набор open source-промптов, которые должны помочь разработчикам создавать ИИ-приложения безопаснее для подростков. Компания предлагает применять их наряду со своей моделью модерации gpt-oss-safeguard, но отмечает, что эти политики можно адаптировать и для других моделей.

Речь идет не о готовом приложении, а о наборе правил, которые помогают заранее задать границы допустимого поведения ИИ. В них затрагиваются темы графического насилия, сексуального контента, опасных челленджей, вредных представлений о теле, романтического или агрессивного ролевого взаимодействия, а также товаров и услуг с возрастными ограничениями.

Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее. 

В OpenAI объясняют, что даже опытным командам сложно перевести общие цели безопасности в точные и рабочие правила. В результате защита часто получается либо непоследовательной, либо слишком размытой, либо, наоборот, чрезмерно жесткой. Новый набор промптов должен дать разработчикам базовый каркас, который можно дорабатывать под свой продукт.

Над этими политиками OpenAI работала вместе с организациями Common Sense Media и everyone.ai. В компании подчеркивают, что это не полноценное решение всех проблем AI safety, а скорее минимальный практический уровень защиты, который можно быстро встроить в продукт.

На фоне растущего внимания к тому, как ИИ взаимодействует с несовершеннолетними, такой шаг выглядит логичным. Особенно для небольших команд, у которых нет собственных ресурсов на разработку сложной системы модерации с нуля.

Читают сейчас

Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике

51 минуту назад

Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике

Китайская компания-разработчик человекоподобных роботов UBTech Robotics ищет главного учёного по робототехнике, предлагая зарплату до $18 млн в год. Компания указывает, что эта должность будет определ

Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS

58 минут назад

Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS

Моддер с форума Overclock.net с помощью Claude целиком переписал BIOS материнской платы ASUS Z790 и загрузил Windows 11 на серверном 12-ядерном процессоре Intel Bartlett Lake Core 9 273PQE, который In

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

1 час назад

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

В подсистеме подключения устройств OpenClaw — ИИ-агента с 348 000 звезд на GitHub — за шесть недель обнаружили шесть уязвимостей класса CWE-863 (некорректная авторизация). Последняя, CVE-2026-33579 с

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

1 час назад

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

Valve тестирует в Steam средство для анализа FPS на конкретном ПК до покупки игры пользователем, сообщил датамайнер dex3108 на форуме ResetEra, обнаруживший строки кода этой функции. Сама организация

Microsoft вложит $10 млрд в японские ИИ-проекты

2 часа назад

Microsoft вложит $10 млрд в японские ИИ-проекты

До 2029 года Microsoft планирует инвестировать $10 млрд в инфраструктуру искусственного интеллекта и облачных вычислений Японии, пишет местное информационное агентство Kyodo News со ссылкой на вице-пр