3 часа назад
GPT-5.5 взял 130 IQ на закрытом тесте TrackingAI

OpenAI GPT-5.5 Pro и GPT-5.5 Thinking набрали по 130 баллов на закрытом IQ-тесте TrackingAI и разделили первое место среди текстовых моделей. На стандартной шкале IQ 130 — это приблизительно граница верхних 2% населения, именно по этому критерию Mensa приглашает кандидатов с одобренного теста.
TrackingAI ведет два теста: публичный Mensa Norway и закрытый Offline Test. Открытый тест доступен в интернете, поэтому его вопросы, ответы или разборы могли попасть в обучающие информация моделей. Offline Test, по словам авторов проекта, составил участник Mensa; эти вопросы не публиковались в сети и не должны были попасть в обучение ИИ. Поэтому приватный тест интереснее как тест способности решать новые задачи, а не узнавать уже виденные закономерности.
Еще одна важная деталь: TrackingAI отдельно прогоняет модели в текстовом режиме с включенным компьютерным зрением. Первым IQ-задачи описывают словами, а вторым показывают изображение задания. Следовательно результаты нельзя смешивать в одну общую таблицу: текстовая схема зависит от качества описания, а схема с компьютерным зрением тестируется еще и на способность самостоятельно прочитать визуальную задачу.
Именно в связи с этих разделений GPT-5.5 нельзя просто объявить "самым умным ИИ". На закрытом Offline Test текстовые GPT-5.5 Pro и GPT-5.5 Thinking лидируют, но на публичном Mensa Norway среди текстовых моделей GPT-5.5 Thinking не начальный: выше в таблице стоят Grok-4.20 Expert Mode, Gemini 3.1 Pro Preview и Claude-4.7 Opus Extended Thinking. Кроме того, этот формат проверяет прежде всего абстрактную логику, а не программирование, научную работу, надежность или работу в роли агента.
Аккуратный вывод такой: GPT-5.5 стал лидером важной части IQ-рейтинга TrackingAI, особенно на закрытом наборе задач. Это сильный результат для задач на абстрактное мышление, но не универсальное доказательство превосходства над всеми ИИ во всех возможных тестах.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

38 минут назад
FDA одобрило первую генную терапию наследственной глухоты
Управление по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) одобрило первую генную терапию для восстановления слуха у людей, которые родились глухими. Речь идёт о лечении вес

41 минуту назад
DeepSeek AI: “V4 отстаёт от лучших ИИ-моделей всего на 3–6 месяцев”
Компания DeepSeek AI полагает, что её флагман V4-Pro-Max “демонстрирует превосходство над GPT-5.2 и Gemini-3.0-Pro в стандартных бенчмарках рассуждений”, но “незначительно уступает GPT-5.4 и Gemini-3.
49 минут назад
Выпускники проекта «Исходник будущего» получат преимущества при поступлении в Центральный университет с грантами до 100%
Минцфиры РФ и Центральный университет объявили о стратегическом партнёрстве в рамках проекта «Исходник будущего». Выпускники образовательной инициативы Минцифры России смогут поступить в Центральный у

1 час назад
Microsoft запустила обновлённую программу Windows Insider
Microsoft объявила о пересмотре программы раннего доступа Windows Insider. Структуру программы упростили, кроме того, в бета-канале больше не будет поэтапного внедрения функций, сообщает Bleeping Comp

2 часа назад
Anthropic запустила ИИ-маркетплейс, где нейросети продавали и покупали реальные товары за настоящие деньги
Anthropic создала тестовую торговую площадку, на которой агенты ИИ выступали как представители покупателей и продавцов и пытались заключить максимально выгодные сделки. В компании решили проверить, на