Обучение с подкреплением: преодолевая ограничения процессов без марковских свойств
В новой работе исследователи предлагают алгоритмы обучения с подкреплением, использующие аппроксимацию функций, для систем, где текущее состояние недостаточно для прогнозирования будущего.
![Решения для β демонстрируют зависимость от значения [latex]c[/latex] в гиперкубической и [latex]\ell_{2}[/latex]-областях, что позволяет установить связь между параметрами и соответствующими решениями.](https://arxiv.org/html/2601.00272v1/solutions_l2.png)


![В предложенной схеме композиционного векторного квантования низкоразмерного кодекса входное изображение преобразуется в непрерывное латентное пространство [latex]zz[/latex], которое масштабируется билинейной интерполяцией с коэффициентом β, после чего каждый вектор признаков разделяется на [latex]m[/latex] блоков и квантуется с использованием общего кодекса [latex]\mathcal{C}[/latex], содержащего [latex]K[/latex] кодовекторов размерности [latex]d^* = d/m[/latex], а затем собранные и усреднённые блоки восстанавливают исходную форму [latex]zz[/latex], после чего декодер преобразует полученную карту признаков обратно в изображение.](https://arxiv.org/html/2601.00222v1/x2.png)
![Разработанная схема MORE-ML, объединяющая квантово-механические свойства молекулярных блоков с методами машинного обучения, позволяет предсказывать характеристики связывания, такие как [latex]E_{ads}[/latex], [latex]\Delta\phi[/latex] и [latex]\Delta Q[/latex], посредством регрессии и анализа объяснимости модели, при этом оптимизация гиперпараметров достигается через байесовскую оптимизацию с 100 итерациями и 10-кратной перекрестной проверкой, а предварительный отбор данных осуществляется с использованием обнаружения аномалий и метода farthest point sampling.](https://arxiv.org/html/2601.00503v1/FIG3_ML_workflow.png)
![Поздние хвосты решений для компактных гауссовых начальных данных демонстрируют, что, хотя закон распада мощности согласуется с классической общей теорией относительности, амплитуда этих хвостов и переход от фазы, доминируемой квазинормальными модами, к фазе, доминируемой хвостами, оказываются чувствительными к параметру квантовой модификации α, а также к центру [latex]R\_0[/latex] и ширине [latex]w\_0[/latex] гауссова волнового пакета.](https://arxiv.org/html/2601.00164v1/Fig1_l4_nc.png)
![Исследование демонстрирует, что применение симметричной проекции к измерениям диагональных членов позволяет получить более точные оценки энергии связи ядра трития [latex] ^3H [/latex] (в мегаэлектронвольтах), согласующиеся с результатами точных расчетов NCSM, в то время как учет шума, характеризуемого параметром [latex] aa [/latex], приводит к увеличению вклада нежелательных частиц и снижению энтропии запутанности кубитов.](https://arxiv.org/html/2601.00315v1/x2.png)
