GPT-5.5 взял 130 IQ на закрытом тесте TrackingAI

2 мин
GPT-5.5 взял 130 IQ на закрытом тесте TrackingAI

OpenAI GPT-5.5 Pro и GPT-5.5 Thinking набрали по 130 баллов на закрытом IQ-тесте TrackingAI и разделили первое место среди текстовых моделей. На стандартной шкале IQ 130 — это приблизительно граница верхних 2% населения, именно по этому критерию Mensa приглашает кандидатов с одобренного теста.

TrackingAI ведет два теста: публичный Mensa Norway и закрытый Offline Test. Открытый тест доступен в интернете, поэтому его вопросы, ответы или разборы могли попасть в обучающие информация моделей. Offline Test, по словам авторов проекта, составил участник Mensa; эти вопросы не публиковались в сети и не должны были попасть в обучение ИИ. Поэтому приватный тест интереснее как тест способности решать новые задачи, а не узнавать уже виденные закономерности.

Еще одна важная деталь: TrackingAI отдельно прогоняет модели в текстовом режиме с включенным компьютерным зрением. Первым IQ-задачи описывают словами, а вторым показывают изображение задания. Следовательно результаты нельзя смешивать в одну общую таблицу: текстовая схема зависит от качества описания, а схема с компьютерным зрением тестируется еще и на способность самостоятельно прочитать визуальную задачу.

Именно в связи с этих разделений GPT-5.5 нельзя просто объявить "самым умным ИИ". На закрытом Offline Test текстовые GPT-5.5 Pro и GPT-5.5 Thinking лидируют, но на публичном Mensa Norway среди текстовых моделей GPT-5.5 Thinking не начальный: выше в таблице стоят Grok-4.20 Expert Mode, Gemini 3.1 Pro Preview и Claude-4.7 Opus Extended Thinking. Кроме того, этот формат проверяет прежде всего абстрактную логику, а не программирование, научную работу, надежность или работу в роли агента.

Аккуратный вывод такой: GPT-5.5 стал лидером важной части IQ-рейтинга TrackingAI, особенно на закрытом наборе задач. Это сильный результат для задач на абстрактное мышление, но не универсальное доказательство превосходства над всеми ИИ во всех возможных тестах.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

1 час назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

2 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

3 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

5 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения

Апдейт Telegram: форматирование ботов и Markdown-файлы

6 часов назад

Апдейт Telegram: форматирование ботов и Markdown-файлы

Telegram опубликовал крупное обновление с десятками новых функций, в том числе с поддержкой мессенджера на смарт-часах, в том числе с Wear OS, а также опциями для ботов, групп и встроенного браузера.