ИИ-компании скупают у закрывающихся стартапов рабочие переписки для обучения нейросетей

2 мин
ИИ-компании скупают у закрывающихся стартапов рабочие переписки для обучения нейросетей

Компании, разрабатывающие ИИ-сервисы, нашли свежий источник данных для обучения своих моделей. Они начали скупать у закрывающихся стартапов рабочие переписки в мессенджерах, тикеты в Jira, письма в электронной почте и другие внутренние материалы.

Как пишет Forbes, интерес к таким данным вырос на фоне того, что большие языковые модели уже почти исчерпали публичный контент в интернете. Кроме того, им нужны более сложные и живые примеры реального человеческого взаимодействия по рабочим задачам. Особенно это важно для агентных ИИ-моделей, которые должны не только отвечать на вопросы, но и выполнять часть работы за пользователя.

По данным американской компании SimpleClosure, которая помогает предпринимателям закрывать стартапы, спрос на такие информация со стороны ИИ-компаний оказался весьма высоким. Фирма даже запустила Asset Hub — площадку, где закрывающиеся стартапы могут продать код, архивы Slack, письма и другие рабочие информация. По словам гендиректора SimpleClosure Дори Йоны, за новейший год через Asset Hub прошло почти 100 подобных сделок с выплатами от $10 000 до $100 000.

У конкурента SimpleClosure, компании Sunset, цены на внутренние информация компаний зависят от размера фирмы, её возраста и «насыщенности» данных — то есть того, насколько хорошо внутренние материалы связаны между собой. Особенно ценными считаются тикеты в Jira, привязанные к конкретным коммитам кода.

Новая практика обратила на себя внимание общественников. Марк Ротенберг, основатель Центра искусственного интеллекта и цифровой политики, напоминает, что в таких сделках речь идёт не об абстрактных данных, а о материалах, связанных с конкретными людьми и их работой. Сохраняются риски, что ИИ-системы могут запоминать и воспроизводить личные фрагменты из обучающих наборов. Компания Ротенберга направила письмо в Комитет Сената США по торговле с призывом к Федеральной торговой комиссии изучить новые методы ведения бизнеса в сфере ИИ.

Читают сейчас

Google выпустила Android Studio Panda 4 с режимом планирования задач и встроенным веб-поиском для AI-агентов

27 минут назад

Google выпустила Android Studio Panda 4 с режимом планирования задач и встроенным веб-поиском для AI-агентов

Google выпустила стабильную версию Android Studio Panda 4. Разработчики компании делают ставку на модели, поэтому в IDE появились функции планирования задач AI-агентов, система предсказания правок в к

Meta* планирует провести первую волну увольнений 20 мая 2026 года

1 час назад

Meta* планирует провести первую волну увольнений 20 мая 2026 года

20 мая Meta* намерена провести первую волну масштабных увольнений, запланированных на 2026 год, а затем последуют и другие, пишет Reuters со ссылкой на свои источники. Ознакомиться далее

Вышла GPT Images 2 — схема отлично работает с шрифтами, «думает» и ищет в сети

2 часа назад

Вышла GPT Images 2 — схема отлично работает с шрифтами, «думает» и ищет в сети

OpenAI запустила GPT Images 2 - свою новую схема генерации изображений. Схема "раскатали" на пользователей ChatGPT в течение последних часов, при этом базовая версия доступна в том числе пользователям

Panasonic представила защищённые QR‑коды, которые будут считывать только определённые устройства

2 часа назад

Panasonic представила защищённые QR‑коды, которые будут считывать только определённые устройства

Panasonic представила защищённые QR‑коды, которые могут считывать только определённые устройства в заданных условиях — например, входные терминалы на территории предприятия. Одновременно каким-то друг

Сэм Альтман критикует кибермодель Mythos от Anthropic

2 часа назад

Сэм Альтман критикует кибермодель Mythos от Anthropic

OpenAI и Anthropic продолжают обмениваться взаимными нападками. На этой неделе в процессе выступления на подкасте генеральный директор OpenAI Сэм Альтман раскритиковал новую схема кибербезопасности св