
2 июня 2026, 11:44
Opus 4.8 поставил рекорд в сложнейшем ИИ-бенчмарке. Итог — 1,4%
Claude Opus 4.8 занял первое место в ARC-AGI-3 — интерактивном тесте на общий интеллект, который до сих пор не дается ни одной модели. Релиз в режиме High стала новым лидером с результатом 1,4% на зак

25 марта 2026, 20:55
Вышел тест производительности ARC-AGI-3: люди набирают 100%, GPT-5.4 — 0,26%
ARC Prize Foundation опубликовала технический отчет о третьей версии бенчмарка ARC-AGI — теста на общий интеллект, созданного Франсуа Шолле, автором фреймворка Keras. В противовес предыдущих версий, г