Искусство Рассуждений: Как Оптимизировать ‘Ум’ Машин

Новое исследование показывает, что обучение моделей на более простых задачах и грамотная настройка системы вознаграждений позволяет значительно повысить эффективность их рассуждений и снизить вычислительные затраты.

![На представленных образцах демонстрируется способность TextPecker выявлять структурные аномалии в тексте при различных сценариях рендеринга, при этом визуализация оценки структурного качества осуществляется с использованием параметра [latex] \omega = 1 [/latex].](https://arxiv.org/html/2602.20903v1/x14.png)




![Динамика трансформатора исследовалась на физическом стенде, где предсказание хаотического временного ряда Лоренца на многоосцилляторной системе позволило количественно оценить предпочтения модальности посредством разности значений SHAP для само- и кросс-внимания [latex]\phi(Y) - \phi(X)[/latex], представленной направлением стрелки в диапазоне [-90°, 90°] - от полного вклада [latex]X[/latex] до [latex]Y[/latex] - при этом цвет стрелки отражает нормированную среднеквадратичную ошибку между целевым [latex]z(t)[/latex] и предсказанным значением, что продемонстрировано на примере низких ([latex]\beta_{self}, \beta_{cross} = (10^{-4}, 10^{-4})[/latex]) и высоких ([latex]\beta_{self}, \beta_{cross} = (10^{0}, 10^{0})[/latex]) уровней внимания, фокусируясь на временном интервале [latex]50 \leq t \leq 70[/latex].](https://arxiv.org/html/2602.20624v1/figures/fig6_0111.jpg)