Статьи по тегу

8 апреля 2026, 14:36

Project Glasswing: Anthropic нашла тысячи уязвимостей нулевого дня во всём основном софте

7 апреля 2026 года Anthropic объявила о запуске Project Glasswing - новой инициативы, которая объединяет AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, N

2 апреля 2026, 19:21

Подрядчик OpenAI и Anthropic разрабатывает средство для работы с признаками онлайн-радикализации

Новозеландский стартап-компания ThroughLine, который уже сотрудничает с OpenAI, Anthropic и Google по кризисным сценариям, хочет расширить свою систему поддержки и добавить в неё работу с признаками н

27 марта 2026, 22:21

Исследование: ИИ-модели слишком часто поддакивают пользователю — даже если он неправ

Исследователи из Стэнфорда пришли к выводу, что современные ИИ-чатботы слишком склонны соглашаться с пользователем и поддерживать его позицию — даже в тех случаях, когда речь идет об обмане, социально

25 марта 2026, 23:46

Фейковые рентген-снимки от ИИ научились обманывать не только врачей, но и другие нейросети

Исследователи предупредили о новой уязвимости в медицинском ИИ: сгенерированные нейросетями рентгеновские снимки уже достаточно реалистичны, чтобы вводить в заблуждение не только людей, но и сами AI-с

24 марта 2026, 22:07

OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков

OpenAI представила набор open source-промптов, которые должны помочь разработчикам создавать ИИ-приложения безопаснее для подростков. Компания предлагает применять их вместе со своей моделью модерации