Логика в нейронных сетях: Перевод формальных правил в машинный язык

Новый подход позволяет эффективно переносить принципы формальной логики в нейронные сети, открывая возможности для надежного анализа временных сигналов.

Ускорение больших языковых моделей: новый подход к архитектуре и памяти

Стандартная архитектура больших языковых моделей и её модификации демонстрируют разнообразие подходов к построению систем обработки естественного языка, каждый из которых оптимизирован для решения специфических задач и достижения различных уровней производительности.

Исследователи представили Helios — инновационную систему для обслуживания больших языковых моделей, сочетающую в себе аппаратные и программные решения для повышения производительности и эффективности.

Ускорение ИИ: Новая векторная архитектура для микромасштабирования

Рассмотрена организация векторных регистров для векторно-векторных инструкций Vmxdotp с размером блока [latex]kk[/latex], демонстрирующая выполнение [latex]vl[/latex] независимых операций MX-DPA.

Представленное исследование описывает инновационное расширение RISC-V, значительно повышающее эффективность обработки данных в форматах с низкой точностью для задач искусственного интеллекта.

Лица в алгоритмах: Как понять, насколько точно нас видят машины

Новый подход к оценке алгоритмических решений позволяет проверить, соответствуют ли представления о человеке, используемые машиной, тому, как он сам себя описывает.

Интеллектуальный анализ знаний: ускорение работы графовых нейронных сетей

KG-WISE организует обучение и вывод для больших графов знаний, используя извлечение подграфов под управлением больших языковых моделей, детальное хранение моделей и инстанцирование моделей с учетом запроса.

Новая система KG-WISE использует возможности больших языковых моделей для выделения релевантных подграфов и оптимизации работы с большими графами знаний.

Контекст без границ: новая архитектура для больших языковых моделей

Архитектура SharedLLM, подобная общей схеме кодировщика-декодировщика, как в T5 (Raffel et al., 2020), обеспечивает взаимодействие на первом уровне MM посредством общих ключей-значений, которые кодируются и сжимаются из текстового фрагмента в последовательность деревьев.

Исследователи предлагают инновационный подход к расширению контекстного окна больших языковых моделей, позволяющий обрабатывать значительно больший объем информации.