OpenAI открыла набор на программу Safety Fellowship по безопасности ИИ

2 мин
OpenAI открыла набор на программу Safety Fellowship по безопасности ИИ

OpenAI анонсировала запускание OpenAI Safety Fellowship — программы стипендий для ускорения исследований в области безопасности искусственного интеллекта.

Проект направлена на привлечение талантов для разработки методов контроля рисков, связанных с продвинутыми моделями ИИ, такими как предотвращение нежелательного поведения систем и обеспечение интерпретируемости алгоритмов.

Приложение стартовала в 2025 году с inaugural летним набором, участники которого уже опубликовали ключевую статью на Mechanistic Interpretability Workshop на конференции NeurIPS, а также бумаги, принятые на ICLR. Некоторые феллоу перешли в ведущие организации, включая Goodfire и Redwood Research. В 2026 году OpenAI планирует масштабирование: проведение нескольких циклов феллоушипа, удвоение числа участников и утроение команды.

Контекст создания программы связан с растущими вызовами в AI safety, где Cambridge Boston Alignment Initiative (CBAI), якорная организация по безопасности ИИ в Кембридже с конца 2022 года, играет ключевую роль.

CBAI сотрудничает с университетами Harvard, MIT и Northeastern, организуя воркшопы, такие как Harvard-MIT AI Safety Workshops (пять раз в год в Essex, MA, с 40 участниками и 10 гостями), которые планируется расширить до восьми. Гостями приглашают экспертов из Redwood Research, METR, Google DeepMind, Anthropic и команд OpenAI.

Феллоушип интегрируется с этими усилиями, предлагая не только стипендии до 100 000 долларов и api-кредиты до 1 млн долларов, но и практические проекты по оценке угроз и моделированию рисков. Позиция OpenAI подчеркивает: «Мы ускоряем исследования безопасности ИИ через феллоушипы, производя оригинальные работы».

Последствия для рынка и пользователей значительны: программа усиливает экосистему AI safety, готовя специалистов для фронтирных компаний и снижая системные риски суперинтеллекта.

Масштабирование в 2026 году (летний феллоушип в Boston metro area) повысит конкуренцию за таланты, стимулируя найм — рефералы кандидатов вознаграждаются 5000 долларов. Для пользователей это означает более надежные ИИ-модели с меньшим риском misuse, особенно в cybersecurity и threat research.

Итог — переход феллоу в ключевые фирмы усиливает консенсус по стандартам безопасности, влияя на промышленную политику и вложения в resilient AI-инфраструктуру.

Приложение нацелена на привлечение талантов и подготовку специалистов для решения актуальных проблем в области AI safety. Участники уже сделали значительные шаги в исследованиях, что подчеркивает важность этой инициативы.

Читают сейчас

Глава Microsoft объяснил, почему ИИ не обесценит людей

1 час назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

3 часа назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

3 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

4 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

7 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения