
11 мая 2026, 19:57
Поддельная схема OpenAI воровала пароли, крипту и сессии Discord
Исследователи из HiddenLayer обнаружили вредоносный репозиторий Open-OSS/privacy-filter на Hugging Face, который маскировался под легитимный релиз OpenAI Privacy Filter. За 18 часов он собрал приблизи

6 мая 2026, 07:38
В Anthropic рассказали, как защититься от саботажа ИИ
Что создавать, если ИИ умнее своих проверяющих и саботирует работу? Группа исследователей из Anthropic, MATS, Redwood Research и Оксфорда показала, что обычное дообучение со слабым супервайзером может

23 апреля 2026, 15:38
OpenAI против OpenAI: организация открыла схема для защиты данных от ChatGPT
OpenAI выпустила Privacy Filter — открытую схема на 1,5 млрд параметров, которая находит и маскирует персональные данные в тексте до того, как он уйдет в большую языковую модель. Схема опубликована по

14 марта 2026, 22:33
80% токенов впустую: DeepSeek и GPT-OSS попались на «театральном мышлении»
Исследователи из Goodfire AI и Гарварда обнаружили, что reasoning-модели вроде DeepSeek-R1 (671B) и GPT-OSS (120B) часто занимаются "театральным рассуждением" — модель уже уверена в ответе на 90%, но