25 февраля 2026, 11:27
Разработчиков отечественного ИИ могут обязать раскрывать данные для обучения нейросетей

В России обсуждают инициативу, которая может обязать разработчиков отечественных моделей искусственного интеллекта раскрывать сведения о наборах данных, использованных для обучения и тестирования нейросетей. Предложение рассматривают отраслевые ассоциации, ИИ‑компании и профильный регулятор в рамках подготовки законопроекта об ИИ, пишут «Ведомости» со ссылкой на источники, знакомые с обсуждением.
Согласно одной из рабочих версий документа, разрабатываемого Минцифры России, разработчики должны будут указывать название датасета, дату его создания, назначение, формат, объём и происхождение. Пока не решено, где будет агрегироваться эта данные: обсуждается создание отдельного реестра отечественного ИИ или реестра наборов данных.
Ранее ведомство уже заявляло о планах создать реестр доверенного ИИ для объектов критической инфраструктуры. ОТем не менее на сегодняшний день специализированных реестров ИИ‑технологий в России нет. В текущей версии законопроекта требования о раскрытии данных отсутствуют — документ носит рамочный характер.
Правительство разрабатывает законопроект, который определит критерии «российской» нейросети, правила маркировки ИИ-контента, вопросы авторского права и ответственности за использование технологии. Предполагается гибкий решение: в частности, использование ИИ при совершении преступлений могут признать отягчающим обстоятельством.
Одновременно участники обсуждения отмечают сложности с формулировками — пока не определено, что считать «национальным» и «доверенным» ИИ и какие критерии должны применяться.
В Альянсе в сфере искусственного интеллекта, куда входят крупнейшие технологические компании, отмечают, что полное описание массивов данных в реестровом формате может потребовать несоразмерных ресурсов или свестись к формальному перечислению без практической ценности. Одновременно отрасль готова к обсуждению ответственного использования данных.
Эксперты видят в инициативе как преимущества, так и риски. Руководитель направления ИИ Cloud.ru Дмитрий Юдин считает, что раскрытие данных повысит доверие к моделям и сформирует единые стандарты отчётности. В то же время это создаст дополнительную нагрузку на разработчиков, особенно при частых обновлениях моделей, и может замедлить внедрение сервисов.
По мнению заместителя исполнительного директора Центра компетенций НТИ по большим данным МГУ имени М. В. Ломоносова Гарника Арутюняна, требования могут затронуть не только российских игроков, но и зарубежные компании, такие как OpenAI и Microsoft, которые вряд ли станут их соблюдать.
Эксперты считают, что раскрытие источников данных может способствовать формированию коммерческого рынка данных. Сейчас авторы часто используют открытые источники бесплатно и без разрешения владельцев, что остаётся «серой зоной» регулирования и создаёт риски утечек персональных данных и нарушений авторских прав.
В качестве примера зарубежной практики приводится европейский AI Act, обязывающий раскрывать источники данных. Крупные поставщики контента, включая Wikimedia Foundation и Reddit, уже заключают платные соглашения с разработчиками ИИ.
Случаи конфликтов вокруг использования данных уже происходили: в 2023 году The New York Times подала иск против Microsoft и OpenAI, обвинив их в незаконном использовании материалов для обучения моделей. Эксперты не исключают, что при принятии новых требований подобные судебные прецеденты могут появиться и в России.
С точки зрения участников рынка, ключевой вопрос — готовность компаний раскрывать информацию о данных без ущерба для конкурентных преимуществ. Для крупных моделей с миллионами источников это может оказаться технически сложным и замедлить вывод решений на рынок.
В отрасли сходятся во мнении, что обсуждаемая проект своевременна, однако её реализация потребует баланса между прозрачностью, защитой интеллектуальной собственности и темпами развития технологий.
Читают сейчас

52 минуты назад
Китайский разработчик роботов UBTech Robotics готов платить $18 млн в год главному учёному по робототехнике
Китайская компания-разработчик человекоподобных роботов UBTech Robotics ищет главного учёного по робототехнике, предлагая зарплату до $18 млн в год. Компания указывает, что эта должность будет определ

59 минут назад
Claude смог запустить промышленный CPU Intel на обычной материнской плате — ИИ полностью переписал BIOS
Моддер с форума Overclock.net с помощью Claude целиком переписал BIOS материнской платы ASUS Z790 и загрузил Windows 11 на серверном 12-ядерном процессоре Intel Bartlett Lake Core 9 273PQE, который In

1 час назад
В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец
В подсистеме подключения устройств OpenClaw — ИИ-агента с 348 000 звезд на GitHub — за шесть недель обнаружили шесть уязвимостей класса CWE-863 (некорректная авторизация). Последняя, CVE-2026-33579 с

1 час назад
В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем
Valve тестирует в Steam средство для анализа FPS на конкретном ПК до покупки игры пользователем, сообщил датамайнер dex3108 на форуме ResetEra, обнаруживший строки кода этой функции. Сама организация

2 часа назад
Microsoft вложит $10 млрд в японские ИИ-проекты
До 2029 года Microsoft планирует инвестировать $10 млрд в инфраструктуру искусственного интеллекта и облачных вычислений Японии, пишет местное информационное агентство Kyodo News со ссылкой на вице-пр