Искусственный интеллект — Страница 68

Оптимизация работы больших языковых моделей: динамическая маршрутизация и каскадирование

07.03.2026 от Денис Аветисян

В статье представлен обзор современных методов интеллектуального распределения запросов между различными большими языковыми моделями для повышения эффективности и снижения затрат.

Языковые модели в реальном времени: от статики к динамике

07.03.2026 от Денис Аветисян

В параллельных потоковых больших языковых моделях реализовано динамическое планирование чтения входных данных и генерации выходных данных, позволяющее модели адаптировать взаимодействие для оптимизации производительности.

Новый обзор исследует эволюцию больших языковых моделей в сторону мгновенного взаимодействия и обработки потоковых данных.

Рассуждения с Подкреплением: Новый Подход к Поиску Знаний

07.03.2026 от Денис Аветисян

$При фиксированном начальном отрезке траектории [latex]\tau < t[/latex], разработанный метод групповой траекторной оптимизации (GRPO) локализует всю вариативность сэмплируемой группы на шаге [latex]t[/latex], обеспечивая более эффективный процесс оптимизации.$

Исследователи предлагают эффективный метод обучения больших языковых моделей рассуждать с использованием внешних источников знаний, значительно повышая точность и скорость обучения.

ИИ-помощник для разработчика: от идеи до рабочего терминала

07.03.2026 от Денис Аветисян

В статье представлен OpenDev — открытая платформа для создания ИИ-агентов, способных решать сложные задачи программирования непосредственно в командной строке.

Мультимодальная идентификация объектов: новый подход к объединению данных

07.03.2026 от Денис Аветисян

В статье представлена инновационная методика, позволяющая повысить точность распознавания объектов на основе анализа данных из различных источников.

Модели преобразования языка: новый взгляд на предсказание связывания белков и лигандов

07.03.2026 от Денис Аветисян

$Исследование среднего и максимального размера очереди [latex] |Q| [/latex] для трех трансдьюсеров при различных порогах обрезки τ на текстовых данных (параграф 1 WikiText, объемом 833 и 850 байт) и на самой длинной белковой последовательности (P83127, 12 аминокислот) демонстрирует, что трансдьюсеры [latex] f_{\alpha} [/latex] и [latex] f_{\mathrm{dna2aa}} [/latex] с универсальными состояниями ([latex] |R|=0 [/latex] повсеместно) имеют иную динамику очереди по сравнению с трансдьюсером [latex] f_{\mathrm{ptb}} [/latex], имеющим не-универсальные состояния, что требует дополнительного отслеживания остаточного размера [latex] |R| [/latex].$

В статье представлена инновационная архитектура нейронной сети на графах, позволяющая с высокой точностью прогнозировать аффинность связывания белков и лигандов.

Ожившие Миры: Новая Эра Видеогенерации

07.03.2026 от Денис Аветисян

$В разработанной системе DreamWorld, многомодальные признаки, извлеченные экспертными моделями и подвергнутые воздействию шума, объединяются посредством линейных слоев [latex]W_{in}^+[/latex] и [latex]W_{out}^+[/latex] для совместного предсказания внешнего вида и знаний о мире, при этом достоверность генерации обеспечивается за счет функции потерь Dream Loss и механизма Consistency Constraint Annealing, а на этапе вывода внедрённый механизм Multi-Source Inner-Guidance использует внутренние шумовые признаки для направленного управления процессом генерации видео.$

Исследователи представили DreamWorld — систему, способную создавать более реалистичные и связные видеоролики, объединяя знания из различных источников.

Знания внутри: Как большие языковые модели проверяют факты без поиска

07.03.2026 от Денис Аветисян

Проверка фактов осуществляется без обращения к внешним базам знаний, позволяя оценивать достоверность утверждений, полученных из любых источников - будь то человек или большая языковая модель.

Новое исследование показывает, что современные языковые модели способны самостоятельно оценивать достоверность утверждений, используя собственные знания, без обращения к внешним источникам.

Низкобитные механизмы внимания: ключ к эффективному обучению

07.03.2026 от Денис Аветисян

Косинусная близость между SageBwd и SDPA по слоям в различных конфигурациях демонстрирует, что эти алгоритмы демонстрируют схожее поведение при изменении настроек, что указывает на их потенциальную взаимозаменяемость или возможность комбинированного использования.

Новое исследование раскрывает секреты успешного обучения моделей с низкобитным вниманием, позволяя добиться производительности, сравнимой с полноточными аналогами.

Предсказывая Неожиданные Переходы: Машинное Обучение на Службе Динамических Систем

07.03.2026 от Денис Аветисян

Использование подхода на основе нейронных сетей для решения уравнений (EINNs) позволяет предсказывать критические точки бифуркации в динамической системе [latex] (4) [/latex], причем анализ диаграммы бифуркации, дополненный информацией о линейной устойчивости равновесных точек, выявляет переходы между стабильными и нестабильными состояниями.

Новый подход, основанный на глубоком обучении, позволяет выявлять критические точки в сложных системах и предсказывать резкие изменения их поведения.