Андрей Карпати рассказал, как ИИ ведет за него вики на 400 000 слов

2 мин
Андрей Карпати рассказал, как ИИ ведет за него вики на 400 000 слов

Бывший директор по ИИ в Tesla и сооснователь OpenAI Андрей Карпати поделился методом, которым пользуется все активнее: он собирает сырые материалы по определенной теме — статьи, научные работы, репозитории, датасеты — в одну папку, а затем LLM "компилирует" из них полноценную вики. На выходе — коллекция markdown-файлов с саммари, перекрестными ссылками и статьями по отдельным концептам. Одна из его текущих баз — порядка 100 статей и 400 000 слов, и ни одна запись не написана вручную.

Основной сюрприз — в том, чего Карпати не использует. По его словам, он ожидал, что для вопросов к такому массиву придется строить RAG-пайплайн, однако LLM-агент справляется сам: схема поддерживает индекс-файлы, краткие описания документов и без дополнительной инфраструктуры находит нужные фрагменты. В качестве интерфейса для просмотра Карпати использует Obsidian, а для презентаций — структура Marp.

Отдельно он описал цикл, в котором результаты запросов возвращаются обратно в базу. Ответы на вопросы, сгенерированные графики и слайды "подшиваются" в вики и обогащают ее для следующих запросов. LLM также проводит "проверки здоровья": ищет противоречия, восполняет пробелы через веб-поиск и предлагает темы для новых статей.

В перспективе Карпати видит второй шаг — синтетические данные и дообучение, чтобы LLM "знала" содержимое базы на уровне весов, а не контекстного окна. А решение в общем и целом он оценил одной фразой: здесь есть место для нового продукта — вместо "набора костылей из скриптов", которыми это пока остается.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Глава Microsoft объяснил, почему ИИ не обесценит людей

2 часа назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

4 часа назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

5 часов назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

5 часов назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

8 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения