Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

3 мин
Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

Индустрия искусственного интеллекта годами развивалась по пути грубой силы — бесконечного наращивания вычислительных мощностей. Но когда физические пределы «железа» стали очевидны, в игру вернулась чистая математика.

В среду, 25 марта 2026 года, на биржах произошла аномалия. Пока индекс Nasdaq уверенно рос, акции гигантов индустрии памяти — Micron, Western Digital, Seagate, а равным образом производителей оборудования Lam Research и Applied Materials — синхронно ушли в минус. Триггером стала не геополитика и не сбои в логистике, а публикация одной научной статьи от Google Research.

Команда инженеров Google представила TurboQuant — механизм, способный сжать так называемый KV-кэш (память, в которой нейросеть удерживает контекст диалога) до 3 бит. И самое важное: механизм не снижает точность ответов и ускоряет вычисления в 8 раз на чипах NVIDIA H100.

До этого момента индустрия решала проблему огромных контекстов грубой силой: просто закупала всё больше дорогих чипов памяти. Инженеры Google предложили альтернативу — перестать раздувать аппаратные мощности и переписать саму математику работы ИИ с данными.

Квантование полярных координат

В основе TurboQuant лежит отказ от привычных систем координат. Современные алгоритмы теряют критически важные информация, когда пытаются сжать информацию сильнее 4 бит. Google обошла этот барьер с помощью квантования полярных координат PolarQuant.

Вместо того чтобы хранить тяжелые многомерные координаты данных, алгоритм переводит их в полярную систему — запоминает только радиус и угол. Оказалось, что для нейросетей направление вектора куда важнее точного расстояния. А неизбежные при таком жестком сжатии ошибки механизм аккуратно сглаживает дополнительным модулем QJL (Quantized Johnson-Lindenstrauss) — он просто прячет лишний «шум» в безопасное математическое пространство, где тот не мешает вычислениям.

Этот изящный трюк создает неожиданную проблему даже для гегемона рынка — NVIDIA. Софтверный буст делает их текущие чипы H100 настолько эффективными, что клиенты могут решить подождать и отложить закупку новых, более дорогих процессоров.

Реакция рынка

Торговые алгоритмы Уолл-стрит отреагировали прямолинейно: если Google в шесть раз сокращает потребность ИИ в памяти, значит, дата-центрам больше не нужно скупать SSD и чипы в прежних объемах.

Однако аналитики Morgan Stanley призывают не паниковать. Они называют долгосрочный эффект для производителей железа «нейтрально-позитивным». Срабатывает парадокс Джевонса: когда источник становится использовать проще и дешевле, его потребление не падает, а наоборот — взлетает.

Падение требований к памяти сильно удешевит запускание ИИ. Нейросети, которым раньше требовались целые серверные стойки, теперь смогут функционировать локально или на дешевом оборудовании. Это не убьет спрос на кремний, а откроет двери для тысяч новых проектов, которые раньше были просто не по карману.

Официально TurboQuant покажут в апреле на конференции ICLR 2026 в Рио-де-Жанейро. И, кажется, это отличный сигнал: индустрия ИИ перестает решать все проблемы исключительно грубой силой. Гонка «железа» никуда не денется, но теперь выигрывать в ней будут не только бесконечными бюджетами на память, но и красивой математикой.

Читают сейчас

Глава Microsoft объяснил, почему ИИ не обесценит людей

1 час назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

3 часа назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

Google отключил оператор inurl

3 часа назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

4 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

Microsoft выпустила версию PowerToys 0.100.0

7 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения