Трансформеры: Предел вычислительной мощи?

Новое исследование показывает, что стандартные алгоритмы, вероятно, уже близки к оптимальным для вычислений в трансформерах, а значительное ускорение потребует принципиально новых подходов.

Головоломки пространства: как нейросети решают задачи на топологию

Коэффициенты корреляции Спирмена демонстрируют взаимосвязь между результатами модели на TopoBench, существующих головоломках (KORGym, Enigmata) и общих тестах на рассуждение (ARC-AGI-1/2, AIME 2025, AA Intelligence), указывая на то, что все головоломки коррелируют с существующими бенчмарками.

Новое исследование представляет TopoBench — сложный набор задач, позволяющий оценить способность больших языковых моделей к пространственному мышлению и решению топологических головоломок.

Генерирующие модели: новый подход с использованием тензорных сетей

Исследование демонстрирует, что предложенная модель UMPS способна генерировать результаты, сопоставимые с моделью MPS, обученной на значительно большем наборе данных ([latex]|\mathcal{T}|=300[/latex]) и с максимальным размером связей [latex]r_{\max}=400[/latex], при этом используя существенно меньшее количество слоев [latex]l_{\max}=4[/latex] вместо [latex]l_{\max}=25[/latex].

Исследователи предлагают эффективный метод генерации данных, основанный на унитарных матричных произведениях состояний и оптимизации на римановых многообразиях.

Квантовый Автоматизм: Разговор с Вишалом Чатратом

Квантовый Автоматизм: Разговор с Вишалом Чатратом Парадоксально, но для того, чтобы управлять квантовым миром, мы строим все более сложные классические системы автоматизации. Это как пытаться поймать призрак с помощью сложного механизма. Но, как ни странно, именно этот подход может стать ключом к созданию масштабируемых квантовых вычислений. Представьте себе настройку радиоприемника. Чтобы поймать четкий сигнал, нужно … Читать далее

В поисках оптимального дерева: новые горизонты GPU-вычислений

Глубина поиска в ширину (BFS) и глубина поиска в глубину с ограничениями связности (GConn RST) сравниваются, демонстрируя зависимость между этими двумя подходами к исследованию пространства состояний.

Исследование показывает, что алгоритмы, основанные на эйлеровых турах, превосходят традиционный обход в ширину при построении корневых остовных деревьев на графических процессорах.

Григорианский хорал в цифре: новый корпус и инструменты для исследований

Данная схема данных PyCantus, упрощенная до атрибутов

Представлен CantusCorpus v1.0 — обширный, стандартизированный набор данных григорианских песнопений, открывающий новые возможности для цифровой и вычислительной музыкологии.

Реалистичные изображения в реальном времени: новый подход к улучшению графики

Гиперреалистичное изображение, полученное посредством HyPER-GAN (представлено справа), демонстрирует значительное улучшение качества синтезированного изображения, исходным материалом для которого послужил кадр из игры Resident Evil Requiem (слева).

Исследователи представили HyPER-GAN — эффективный метод преобразования изображений, позволяющий значительно улучшить качество синтетической графики с минимальной задержкой.

Бесконечные Трансформеры: Цена Алгоритмического Обучения

Обучение моделей на задачах размера T₀ с достижением точности δ требует P₀(δ) примеров данных, после чего дообучение на более крупных задачах (T > T₀) позволяет сохранить точность δ, используя лишь PP дополнительных примеров, при этом для задач индукции и сортировки количество PP растёт логарифмически, что указывает на успешное усвоение алгоритма, тогда как для задач поиска кратчайшего пути и минимального разреза как глубокие, так и стандартные архитектуры демонстрируют сверхлинейный рост PP.

Новое исследование раскрывает теоретические границы сложности обучения алгоритмов нейронными сетями-трансформерами, показывая, как оценить их возможности с помощью методов ядра.

Моделирование пучков частиц: новый подход к расчетам электромагнитных полей

На схеме представлен процесс согласования пучка частиц с ускоряющей структурой, в котором используются две сетки для вычислений самосогласованного поля и волновых эффектов, что позволяет детально смоделировать взаимодействие и оптимизировать параметры ускорения.

В статье представлена инновационная методика, позволяющая повысить точность и эффективность моделирования динамики пучков заряженных частиц в ускорителях.

Тонкий SVD в смешанной точности: ускорение вычислений без потери качества

На рисунке продемонстрировано сравнение точности различных алгоритмов вычисления сингулярного разложения (SVD) для узких и высоких матриц, где результаты, полученные на 80 тестовых матрицах (обозначенных номерами от 1 до 80 по оси абсцисс), позволяют оценить эффективность каждого метода.

В новой статье представлен алгоритм, позволяющий значительно повысить производительность вычислений сингулярного разложения (SVD) за счет использования смешанной точности и оптимизации работы с матрицей Грама.