Статьи по тегу

16 часов назад

Энтузиаст создал программа с уязвимостью и потратил $1500, чтобы проверить, смогут ли ИИ его взломать

Исследователь Касра Раджерди разработал уязвимое программа и потратил $1500, чтобы проверить, смогут ли большие языковые модели его взломать. Для эксперимента он разработал простое приложение на React

8 июня 2026, 23:54

Из ИИ-агентов выходят хорошие программисты, но плохие биологи. Anthropic объясняет почему

Организация Anthropic выпустила разбор о том, почему ИИ-агенты уже стали сильными программистами, но в биологии буксуют. Ответ авторов: проблема не в уме агента, а в данных, по которым он движется. Он

8 июня 2026, 17:56

Вышел SWE-Marathon: тест производительности, где агенты часами пишут исходник — и почти никто не доходит до финиша

Организация Abundant AI выпустила SWE-Marathon — свежий тест производительности для ИИ-агентов, который проверяет не привычные короткие багфиксы, а способность часами работать над одной большой задаче

5 июня 2026, 12:45

ChatGPT научили «видеть сны», чтобы лучше помнить пользователя

4 июня OpenAI представила новую систему памяти для ChatGPT под названием Dreaming V3. Идея в том, что чат-бот теперь в фоновом режиме "видит сны" — сам перебирает прошлые диалоги и собирает из них цел

4 июня 2026, 00:44

Replit назвал Opus 4.8 лучшим ИИ для вайб-кодинга

В обновленном рейтинге ViBench — бенчмарке, который проверяет, насколько хорошо ИИ собирает приложения с нуля по текстовому описанию, — первое место заняла модель Opus 4.8 от Anthropic. В задаче "собр

3 июня 2026, 00:00

OpenAI научила Codex разрабатывать сайты, а равным образом функционировать за банкира, продавца и маркетолога

Компания OpenAI научила Codex собирать интерактивные сайты и приложения по обычному описанию задачи. Новую функцию Sites представили на стриме Intelligence at Work наряду с двумя другими новинками — и

1 июня 2026, 00:03

SWE-rebench: Opus 4.8 стал экономнее, но в эффективности уступил GPT-5.5

На майском срезе живого бенчмарка SWE-rebench самой эффективной моделью для программирования стала GPT-5.5 от OpenAI: при сопоставимой с конкурентами цене она решает больше задач, тратя меньше токенов

29 мая 2026, 22:04

GPT-5.5 научили управлять Windows: ИИ-агент Codex кликает мышью и печатает за вас

OpenAI объявила, что опция computer use в Codex теперь работает на Windows. Это значит, что ИИ-агент может функционировать на компьютере так же, как человек: видеть содержимое экрана, перемещать курсо

29 мая 2026, 12:37

OpenAI дала японским банкам доступ к GPT-5.5 для защиты от кибератак

OpenAI предоставила некоторым японским финансовым организациям доступ к своей новой модели GPT-5.5. Об этом сообщила министр финансов Японии Сацуки Катаяма после встречи с директором по стратегии Open