Разум и язык: как большие модели связывают логику с генерацией текста

Новое исследование выявляет ключевые компоненты в многоязычных моделях, отвечающие за соединение скрытого логического мышления с формированием связных предложений на целевом языке.

Гибкий активатор для нейросетей: снижение затрат и повышение эффективности

Новая архитектура GRAU позволяет значительно сократить аппаратные ресурсы, необходимые для вычислений в нейронных сетях, без потери производительности.

Динамические CNN: Новый взгляд на универсальность нейросетей

Исследование показывает, что динамические сверточные нейронные сети с механизмами внимания демонстрируют превосходные результаты в различных задачах, от анализа изображений до обработки временных рядов.

Код из слов: Насколько хорошо языковые модели справляются с параллельным программированием?

Масштабирование сгенерированного кода, сгруппированное по эталонным задачам, демонстрирует зависимость производительности от сложности решаемой проблемы, выявляя закономерности в эффективности алгоритмов при увеличении объема и разнообразия входных данных.

Новое исследование оценивает возможности больших языковых моделей генерировать эффективный и масштабируемый параллельный код для сложных задач.

Таксономии нового поколения: возможности больших языковых моделей

В области технологий представлен способ объединения иерархических таксономий, при котором общие узлы выделяются зелёным цветом, а уникальные для каждой таксономии - синим и красным, что позволяет визуализировать степень пересечения и различия между различными классификационными системами.

Исследователи предлагают инновационный подход к автоматическому расширению и обогащению существующих таксономий с помощью передовых языковых моделей.

Сжатие данных в реальном времени для ускорения машинного обучения на графах

Модуль разреженного сжатия, продемонстрированный на примере детектора Belle II ECL, обеспечивает компрессию данных, поступающих непосредственно от фронтенда детектора, для последующей обработки в акселераторе потоковых данных, что позволяет оптимизировать производительность системы.

Новый подход к аппаратной компрессии разреженных данных позволяет эффективно обрабатывать потоки информации в задачах машинного обучения, особенно в системах триггеров для коллайдерных экспериментов.