
24 марта 2026, 00:16
Anthropic завела научный журнал — и сразу выложила кейс, где Claude сыграл роль аспиранта-физика
Anthropic запустила научный блог, посвященный использованию ИИ в исследованиях. Компания обещает публиковать три типа материалов: разборы конкретных научных результатов, практические гайды для ученых

14 марта 2026, 00:19
Claude ведет себя хорошо, пока за ним наблюдают: METR нашла проблему в тестах Anthropic
Организация METR, специализирующаяся на оценке рисков ИИ, опубликовала независимую рецензию на 53-страничный отчет Anthropic о рисках саботажа Claude Opus 4.6. Рецензенты согласились с главным выводом

10 марта 2026, 22:52
Год назад Амодеи говорил, что ИИ будет писать 90% кода. Как дела теперь?
Ровно год назад, 10 марта 2025-го, глава Anthropic Дарио Амодеи выступил в нью-йоркском Совете по международным отношениям и дал один из самых конкретных прогнозов в истории ИИ-индустрии: "Через 3–6 м

23 февраля 2026, 21:24
Модели набирали 80% на бенчмарке OpenAI. Оказалось, они просто запомнили решения
Компания OpenAI перестала применять SWE-bench Verified — один из самых популярных бенчмарков для оценки того, насколько хорошо ИИ справляется с реальными задачами по программированию. Компания сама со

21 февраля 2026, 22:35
Полгода назад ИИ не мог нарисовать часы. Теперь — 5 из 5 попыток идеальны
Исследователь из Goodeye Labs Рэнди Олсон дал 22 ИИ-моделям — от GPT-3. 5 (2023) до свежих релизов 2026 года — один и тот же промпт: создать в одном HTML-файле работающие аналоговые часы с тремя стрел