
6 мая 2026, 07:38
В Anthropic рассказали, как защититься от саботажа ИИ
Что создавать, если ИИ умнее своих проверяющих и саботирует работу? Группа исследователей из Anthropic, MATS, Redwood Research и Оксфорда показала, что обычное дообучение со слабым супервайзером может