Связка дешёвых моделей обошла GPT-5.5 и Opus 4.8

1 мин
Связка дешёвых моделей обошла GPT-5.5 и Opus 4.8

OpenRouter запустили Fusion: связка моделей на уровне Fable 5 за полцены.

Промпт уходит параллельно на некоторое количество моделей, каждая с доступом к web search и bash-инструментам. Модель-судья анализирует ответы: ищет консенсус, противоречия, пробелы. Синтезатор пишет финальный ответ.

На DRACO-бенчмарке Perplexity (100 задач по праву, медицине, финансам; ~39 взвешенных критериев на задачу) бюджетная связка из Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro отстала от Fable 5 меньше чем на 1% и обошла GPT-5.5 и Opus 4.8. Стоимость получилась вдвое ниже Fable.

По данным OpenRouter, около 3/4 прироста качества даёт синтез ответов, ещё 1/4 — разнообразие моделей между собой.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

М.Видео: каждый следующий экран в РФ обладает диагональю 27 дюймов

20 минут назад

М.Видео: каждый следующий экран в РФ обладает диагональю 27 дюймов

Аналитики компании по анализировали рынок мониторов в России по итогам I квартала 2026 года. Почти каждый второй проданный экран имеет диагональ 27 дюймов, каждый третий оснащен разрешением QHD, а пок

30 июня завершится прием заявок на грант для AI-проектов

21 минуту назад

30 июня завершится прием заявок на грант для AI-проектов

Привет, ! Время почти на исходе. Успейте заполнить форму до 30 июня, чтобы получить до 2 000 000 ₽ на надежную инфраструктуру под ML-задачи от Selectel. Участвовать могут как стартапы, так и крупные к

Динозавр на HighLoad++: Зачем мы несем службу каталогов на конференцию, где правят бал микросервисы и Kafka

32 минуты назад

Динозавр на HighLoad++: Зачем мы несем службу каталогов на конференцию, где правят бал микросервисы и Kafka

Много лет ты читаешь отчёты с HighLoad++, следишь за докладами и обсуждениями в кулуарах, но все это обычно воспринимается как что-то, наблюдаемое со стороны. Момент же, когда твоя собственная заявка

OpenAI o3 помогла раскрыть 18 редких детских болезней

46 минут назад

OpenAI o3 помогла раскрыть 18 редких детских болезней

Исследователи из Бостонской детской больницы, Гарвардского университета и OpenAI заново разобрали 376 случаев редких генетических болезней у детей, которые специалисты годами не могли решить, — и с по

49 минут назад

У Счётной палаты появились вопросы по IT-закупкам Минфина и Федерального казначейства

Счётная палата выявила ряд нарушений в работе департамента информационных технологий Минфина в контексте проверки использования средств федерального бюджета на закупку ИКТ‑оборудования (в частности, с