OpenAI против OpenAI: организация открыла схема для защиты данных от ChatGPT

3 мин
OpenAI против OpenAI: организация открыла схема для защиты данных от ChatGPT

OpenAI выпустила Privacy Filter — открытую модель на 1,5 млрд параметров, которая находит и маскирует персональные информация в тексте до того, как он уйдет в большую языковую схема. Схема опубликована под лицензией Apache 2.0 на Hugging Face и GitHub — ее можно встроить в коммерческий продукт без роялти.

Ирония момента в том, что OpenAI одновременно отбивается в судах от претензий за использование чужих данных в обучении: от иска The New York Times до временного запрета ChatGPT в Италии в 2023 году после жалоб регулятора. Теперь компания выдает разработчикам инструмент, который позволяет сократить утечку личной информации в LLM. OpenAI утверждает, что использует дообученную версию Privacy Filter в собственной работе с персональными данными.

Работает Privacy Filter не как ChatGPT. Обычная языковая схема пишет ответ по одному слову за раз, Privacy Filter не пишет вообще — он за один проход размечает весь текст, для каждого слова решая, относится ли оно к одной из восьми категорий: имена, адреса, email, телефоны, URL, даты, номера счетов и секреты вроде api-ключей. Отдельный алгоритм склеивает подряд идущие метки, чтобы "Иван Сергеевич Петров" распознался как единое имя, а не три отдельных слова. На выходе — список размеченных фрагментов; разработчик сам решает, стереть их, заменить на заглушку или записать в обратимый токен, чтобы после ответа LLM восстановить исходные информация.

Сам подход — разметка, а не генерация — существовал и до эры LLM, но новизна в том, что классификатор построен на современной архитектуре и понимает контекст: может отличить "123 Main Street" как домашний адрес от того же адреса публичного магазина. Архитектурно модель построена на базе gpt-oss в уменьшенном виде, с контекстным окном 128 тысяч токенов — хватает на длинный документ или многостраничную переписку. Размер (1,5 млрд параметров) даёт возможность запускать ее на обычном ноутбуке и даже в браузере через transformers.js и WebGPU, так что текст не покидает девайс.

На бенчмарке PII-Masking-300k Privacy Filter показывает F1-метрику 96% (precision 94,04%, recall 98,04%). На исправленной версии того же бенчмарка, где OpenAI устранила ошибки разметки, итог — 97,43%. Отдельно компания говорит, что дообучение на небольшом специализированном датасете поднимает точность с 54% до 96% — это важно для задач в узких доменах, где стандартные категории не подходят.

Сама OpenAI подчеркивает, что Privacy Filter — не сертификат о соответствии требованиям и не полноценная анонимизация, а один из слоев в подходе privacy-by-design. Схема может пропускать редкие идентификаторы и иногда чрезмерно или недостаточно маскировать короткий текст с малым контекстом. Качество неравномерно между разными языками. В чувствительных доменах — медицине, юриспруденции, финансах — компания рекомендует сочетать Privacy Filter с человеческим контролем и доменной адаптацией.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Razer представила Atlas Pro — стеклянный коврик для мыши толщиной 1,9 мм

1 час назад

Razer представила Atlas Pro — стеклянный коврик для мыши толщиной 1,9 мм

Razer представила тонкий стеклянный коврик для мыши Atlas Pro, который должен стать более долговечным по сравнению с тканевыми аналогами. Его толщина составляет 1,9 мм, а высота и ширина — 500x400 мм.

2 часа назад

Касперская: доступ к белым VPN имеют менее одного процента компаний РФ, а стабильная работа сервисов под вопросом

Сооснователь «Лаборатории Касперского» и президент группы компаний InfoWatch Наталья Касперская прокомментировала СМИ сообщение о том, что компаниям РФ не ограничивают VPN внутри страны. Читать далее

Microsoft объяснила отказ от официального способа активации Windows 10/11 без интернета

2 часа назад

Microsoft объяснила отказ от официального способа активации Windows 10/11 без интернета

В декабре Microsoft закрыла функция активации Windows по телефону. Теперь организация разместила статью поддержки, содержащую рекомендации по этому поводу. Ознакомиться далее

Минцифры обновило список сайтов и сервисов, которые будут функционировать во время блокировок мобильного интернета

2 часа назад

Минцифры обновило список сайтов и сервисов, которые будут функционировать во время блокировок мобильного интернета

23 апреля 2026 года Минцифры обновило список сайтов и сервисов, которые будут функционировать во время блокировок мобильного интернета. В перечень ресурсов, доступных при отключении интернета, были до

ИИ в сервисе «Яндекс Go» предугадает адрес поездки, подскажет комментарий к месту подачи и покажет время поиска машины

2 часа назад

ИИ в сервисе «Яндекс Go» предугадает адрес поездки, подскажет комментарий к месту подачи и покажет время поиска машины

В сервис «Яндекс Go» авторы «Яндекса» внедрили четыре ИИ‑функции для упрощения процесса заказа такси. Новые опции (ИИ‑подсказки от нейросети на базе Alice AI) помогают пользователям узнать точное врем