Ускорение больших языковых моделей: Квантование памяти внимания без настройки
Новый подход к квантованию кэша памяти внимания позволяет значительно повысить скорость работы больших языковых моделей без потери точности.
Новый подход к квантованию кэша памяти внимания позволяет значительно повысить скорость работы больших языковых моделей без потери точности.
Исследование предлагает математическую основу для существования и уникальности квантовых сплайнов, построенных на основе градиентных потоков четвертого порядка.
Новое исследование демонстрирует возможность точного управления отдельными спиновыми дефектами в монослое дисульфида молибдена, открывая путь к созданию атомарно точных квантовых устройств.

Новое исследование показывает, как манипулирование энергией связи в квантовых точках позволяет создавать электронные насосы, работающие вопреки приложенному напряжению.
![В исследовании демонстрируется, что асимметричные квантовые ямы, спроектированные с использованием квантово-механического моделирования и выращенные методом эпитаксии на сапфировой подложке, позволяют усилить нелинейность второго порядка [latex]\chi^{(2)}[/latex] примерно в 1400 пм/В, что подтверждается измерениями генерации второй гармоники и согласуется с результатами электронно-микроскопических исследований состава, указывая на возможность оптимизации нелинейных оптических свойств материалов за счет контроля асимметрии квантовых ям, достигающей максимума при значении 0.42.](https://arxiv.org/html/2602.23246v1/2602.23246v1/x1.png)
Новое исследование демонстрирует, как искусная инженерия квантовых ям позволяет значительно усилить нелинейные оптические свойства материалов.

В статье представлен обзор текущего состояния исследований реконфигурируемых интеллектуальных поверхностей (RIS) для высокоскоростной беспроводной связи в диапазоне миллиметровых волн.
![В исследовании квантового оптимального транспорта, сходимость двойственной функциональной [latex]D_{\varepsilon}(\bm{\alpha}_{k})[/latex] к оптимальному значению [latex]d^{\*}[/latex] демонстрирует зависимость от параметра регуляризации [latex]\varepsilon[/latex], причём траектории сходимости для фон Неймана (оранжевый) и квадратичной регуляризации (синий) различаются при значениях [latex]\varepsilon[/latex] из множества [latex]\{10^{-2}, 10^{-6}, 10^{-9}\}[/latex], что указывает на тонкую настройку для достижения оптимальной производительности.](https://arxiv.org/html/2602.23144v1/2602.23144v1/pavlo/qot/img/margin_plot0_5.png)
Исследование предлагает математическую основу для минимизации энергии в квантовых системах при ненулевой температуре, открывая новые возможности для управления квантовыми процессами.
Новая архитектура позволяет гибко настраивать точность вычислений в квантованных нейронных сетях, повышая производительность и энергоэффективность.
Квантовые Заметки: Анализ Последних Новостей Знаете, в квантовой механике даже наблюдение влияет на результат. Так и здесь: пытаясь разобраться в новостях, мы неизбежно вносим свою интерпретацию. Но давайте попробуем подойти к этому как физики, а не как журналисты. Представьте себе квантовый компьютер как очень сложный музыкальный инструмент. У него есть потенциал создавать невероятную музыку, но … Читать далее
![Адаптивный алгоритм патчинга, представленный на схеме, итеративно декомпозирует тензорное разложение на более мелкие вычисления посредством нарезки, оценивая сходимость субтензоров [latex]\widetilde{F}^{p\_{1},\dots,p\_{\bar{\ell}}}[/latex] посредством параметров [latex]\chi_p[/latex] и τ, и добавляя сошедшиеся патчи к результатам, пока множество нерешенных задач не станет пустым, что обеспечивает эффективное управление вычислительной сложностью.](https://arxiv.org/html/2602.22372v1/2602.22372v1/x27.png)
В статье представлена стратегия адаптивной сегментации, позволяющая существенно снизить вычислительные затраты при решении многомерных задач с использованием тензорных поездов.