
7 часов назад
Энтузиаст создал программа с уязвимостью и потратил $1500, чтобы проверить, смогут ли ИИ его взломать
Исследователь Касра Раджерди разработал уязвимое программа и потратил $1500, чтобы проверить, смогут ли большие языковые модели его взломать. Для эксперимента он разработал простое приложение на React

8 июня 2026, 23:54
Из ИИ-агентов выходят хорошие программисты, но плохие биологи. Anthropic объясняет почему
Организация Anthropic выпустила разбор о том, почему ИИ-агенты уже стали сильными программистами, но в биологии буксуют. Ответ авторов: проблема не в уме агента, а в данных, по которым он движется. Он

8 июня 2026, 17:56
Вышел SWE-Marathon: тест производительности, где агенты часами пишут исходник — и почти никто не доходит до финиша
Организация Abundant AI выпустила SWE-Marathon — свежий тест производительности для ИИ-агентов, который проверяет не привычные короткие багфиксы, а способность часами работать над одной большой задаче

5 июня 2026, 12:45
ChatGPT научили «видеть сны», чтобы лучше помнить пользователя
4 июня OpenAI представила новую систему памяти для ChatGPT под названием Dreaming V3. Идея в том, что чат-бот теперь в фоновом режиме "видит сны" — сам перебирает прошлые диалоги и собирает из них цел

4 июня 2026, 00:44
Replit назвал Opus 4.8 лучшим ИИ для вайб-кодинга
В обновленном рейтинге ViBench — бенчмарке, который проверяет, насколько хорошо ИИ собирает приложения с нуля по текстовому описанию, — первое место заняла модель Opus 4.8 от Anthropic. В задаче "собр

3 июня 2026, 00:00
OpenAI научила Codex разрабатывать сайты, а равным образом функционировать за банкира, продавца и маркетолога
Компания OpenAI научила Codex собирать интерактивные сайты и приложения по обычному описанию задачи. Новую функцию Sites представили на стриме Intelligence at Work наряду с двумя другими новинками — и

1 июня 2026, 00:03
SWE-rebench: Opus 4.8 стал экономнее, но в эффективности уступил GPT-5.5
На майском срезе живого бенчмарка SWE-rebench самой эффективной моделью для программирования стала GPT-5.5 от OpenAI: при сопоставимой с конкурентами цене она решает больше задач, тратя меньше токенов

29 мая 2026, 22:04
GPT-5.5 научили управлять Windows: ИИ-агент Codex кликает мышью и печатает за вас
OpenAI объявила, что опция computer use в Codex теперь работает на Windows. Это значит, что ИИ-агент может функционировать на компьютере так же, как человек: видеть содержимое экрана, перемещать курсо

29 мая 2026, 12:37
OpenAI дала японским банкам доступ к GPT-5.5 для защиты от кибератак
OpenAI предоставила некоторым японским финансовым организациям доступ к своей новой модели GPT-5.5. Об этом сообщила министр финансов Японии Сацуки Катаяма после встречи с директором по стратегии Open