Разделяемые нейросети: универсальный подход к предсказаниям и генерации

Разработанная разделимая нейронная архитектура (SNA) представляет собой унифицированный примитив для предиктивного и генеративного интеллекта, формализующий класс представлений, строящих высокоразмерные отображения посредством комбинирования обучаемых компонентов низкого порядка (атомов), выбираемых посредством тензора взаимодействий; ограничение порядка взаимодействий и ранга тензора позволяет данной формализации охватывать обобщенные аддитивные, квадратичные и тензорно-разложенные нейронные модели.

В новой статье представлена архитектура разделяемых нейронных сетей (SNA) как мощный инструмент для эффективного моделирования данных в различных областях науки и техники.

Треугольник Хейльбронна: Точные координаты и вычислительная сертификация

Новый подход, объединяющий методы математического программирования с целочисленными переменными и символьные вычисления, позволяет найти оптимальные конфигурации для классической задачи о треугольнике Хейльбронна.

Трансформеры и физика: неожиданные параллели

Архитектура Transformer представляется как последовательность дискретных шагов эволюции, где каждый слой, состоящий из блоков самовнимания, устанавливающих нелокальные связи, и прямой нейронной сети, действующей как локальный оператор, совместно формируют процесс распространения информации, аналогичный развитию системы во времени.

Новое исследование устанавливает связь между архитектурой нейронных сетей «Трансформер» и принципами, используемыми в многочастичной физике, открывая новые перспективы для анализа и оптимизации.

Снятие проклятия сильной CP-проблемы: роль динамического аксиона

Новое исследование с использованием методов тензорных сетей подтверждает механизм Печчи-Квинна, демонстрируя, как динамический аксион естественным образом подавляет нарушение CP-инвариантности.

За пределами свёртки: Новые горизонты обработки изображений

В статье представлен систематизированный обзор структурированных операторов, способных заменить или дополнить стандартную свёртку в задачах глубокого обучения для обработки изображений.