
2 апреля 2026, 19:21
Подрядчик OpenAI и Anthropic разрабатывает средство для работы с признаками онлайн-радикализации
Новозеландский стартап-компания ThroughLine, который уже сотрудничает с OpenAI, Anthropic и Google по кризисным сценариям, хочет расширить свою систему поддержки и добавить в неё работу с признаками н

27 марта 2026, 22:21
Исследование: ИИ-модели слишком часто поддакивают пользователю — даже если он неправ
Исследователи из Стэнфорда пришли к выводу, что современные ИИ-чатботы слишком склонны соглашаться с пользователем и поддерживать его позицию — даже в тех случаях, когда речь идет об обмане, социально

25 марта 2026, 23:46
Фейковые рентген-снимки от ИИ научились обманывать не только врачей, но и другие нейросети
Исследователи предупредили о новой уязвимости в медицинском ИИ: сгенерированные нейросетями рентгеновские снимки уже достаточно реалистичны, чтобы вводить в заблуждение не только людей, но и сами AI-с

24 марта 2026, 22:07
OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков
OpenAI представила набор open source-промптов, которые должны помочь разработчикам создавать ИИ-приложения безопаснее для подростков. Компания предлагает применять их вместе со своей моделью модерации