Трансформеры под ускорением: Новый взгляд на оптимизацию

Исследователи предлагают принципиально новый подход к пониманию и улучшению архитектуры трансформеров, рассматривая их как дискретные алгоритмы оптимизации.

Исследователи предлагают принципиально новый подход к пониманию и улучшению архитектуры трансформеров, рассматривая их как дискретные алгоритмы оптимизации.
![Динамика намагниченности магнитов под воздействием пучков при углах [latex]\theta = \pi[/latex] и [latex]3\pi/4[/latex] на структурах HOPS с [latex]m = \pm 1[/latex] демонстрирует стабилизацию как блоховских скирмионов (в случае DMI), так и антискирмионов, определяя возможность контроля над топологическими спиновыми структурами посредством внешних воздействий.](https://arxiv.org/html/2601.23067v1/FIG.3.jpg)
Новое исследование демонстрирует возможность всеоптического контроля магнитных текстур, включая скайрмионы и антискайрмионы, с помощью структурированного света и расширяет возможности для создания перспективных устройств хранения данных.
![Энергетические уровни связанных состояний в нечетном секторе одноканального сверхпроводящего кубита демонстрируют зависимость от отношения [latex]E_{J}^{\<i>}[/latex] к [latex]E_{C}[/latex], при этом детальное рассмотрение спектра в области [latex]{\cal N}=0[/latex] и [latex]{\cal N}=1/2[/latex] выявляет влияние управляющего сигнала, а асимптотическое поведение при [latex]E_{J}^{\</i>}\gg E_{C}[/latex] и границы континуального спектра служат ориентирами для анализа системы.](https://arxiv.org/html/2601.23100v1/x4.png)
Новое исследование раскрывает, как электромагнитное окружение формирует спектр связанных состояний Андреева в сверхпроводящих кубитах, открывая путь к пониманию эффектов отравления квазичастицами.

Новый подход к исследованию одномерной φ⁴-теории с использованием вейвлет-базиса Дабеши открывает перспективы для изучения сильно взаимодействующих систем.
В статье представлена новая платформа для создания спиновых кубитов, основанная на геликоидальных краевых состояниях двумерного топологического изолятора с магнитной примесью.
Исследователи продемонстрировали устойчивое взаимодействие между радиочастотными фотонами и плазмонными колебаниями электронов, парящих на поверхности жидкого гелия.

В статье представлена архитектура, обеспечивающая синхронизацию цифровых двойников и решающая проблемы гетерогенности и сложности данных в современных производственных системах.
![В первой стадии алгоритма SQUAD, при [latex] K=3 [/latex] и [latex] k \in \{1, ..., 3\} [/latex], выходные данные блоков [latex] B_{1k} [/latex] последовательно оцениваются посредством Exit Test, который, накапливая уверенность классификации [latex] C_{1k} [/latex] в порядке возрастания вычислительных затрат, позволяет прекратить дальнейшую обработку входных данных и сформировать промежуточный прогноз, как только достигнуто условие остановки.](https://arxiv.org/html/2601.22711v1/x1.png)
Новый подход к построению нейронных сетей позволяет динамически подстраивать сложность вычислений, обеспечивая оптимальный баланс между точностью и скоростью работы.
В статье представлен всесторонний обзор современных подходов к созданию цифровых двойников для 3D-упаковки интегральных схем, раскрывающий потенциал технологий для повышения надежности и оптимизации производства.
В статье представлен обзор возможностей алгоритма QR-AAA для эффективного и точного решения широкого спектра вычислительных задач.