13 мая 2026, 20:30

Свежий чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

2 мин

Британский AI Security Institute (AISI) опубликовал отчет о темпах развития кибер-возможностей у передовых моделей. Основной результат: новый внутренний чекпоинт Claude Mythos Preview прошел полигон Cooling Tower — симулятор атаки на промышленную систему управления (industrial control system, ICS) — в 3 из 10 попыток.

Cooling Tower разработан AISI совместно с Hack The Box и имитирует атаку на электростанцию. В кибер-полигонах института предполагается, что начальный доступ к сети атакующий уже получил — проблема модели в том, чтобы развернуть атаку дальше. До нового отчета Cooling Tower не прошла ни одна из протестированных моделей, включая прошлый чекпоинт Mythos Preview и GPT-5.5. AISI прямо отмечает: в начальный раз в их тестировании схема прошла оба кибер-полигона института.

Параллельно AISI прогнал тот же чекпоинт через The Last Ones — 32-шаговую симуляцию взлома корпоративной сети, разработанную с SpecterOps. На эту атаку, по оценке института, человеку-эксперту требуется приблизительно 20 часов работы. Свежий Mythos проходит ее от начала до конца в 6 из 10 попыток. В прошлом отчете тот же Mythos Preview брал The Last Ones в 3 из 10, у GPT-5.5 было 2 из 10. То есть успех почти удвоился между двумя чекпоинтами одной пре-релизной модели за пару месяцев.

AISI меряет так называемый time horizon — длину задач, которые модель решает с надежностью 80%. В ноябре 2025 институт оценивал удвоение этого показателя у передовых моделей в 8 месяцев, к февралю 2026 пересчитал до 4.7 месяцев. Mythos Preview и GPT-5.5 пробивают и эту ускоренную кривую — на графике AISI они выпадают далеко вверх по сравнению с линии тренда. В блоге институт прямо признает, что результаты "существенно превысили даже ускоренный темп" и пока неясно, разовый это всплеск или новая тенденция.

Главное следствие — набор задач AISI близок к насыщению: Mythos и GPT-5.5 решают слишком многое, и точно оценить их реальные возможности становится сложно. Институт готовит более жесткие полигоны и сценарии с активной киберобороной, чтобы тесты лучше отражали реальную обстановку, где атакующему противостоит не пустая сеть, а команда защитников. До этого момента передовые модели бьют любые предельные оценки, которые AISI выставляет, — и каждая следующая итинерация бьет их сильнее предыдущей.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Claude Mythos claude mythos preview

Читают сейчас

31 минуту назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

2 часа назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

3 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

3 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

6 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения