Управление языком: новый подход к долгосрочному планированию

Исследователи предлагают инновационную архитектуру, объединяющую принципы оптимального управления и языковые модели для более эффективного решения задач, требующих планирования на большие горизонты.




![В отличие от подходов, напрямую предсказывающих вознаграждение на основе исходных данных, современные системы используют факторное представление состояния [latex]s_t[/latex] и его соответствие целевым интерпретациям [latex]g_t[/latex] для формирования сигналов прогресса, что позволяет более эффективно оценивать и направлять поведение.](https://arxiv.org/html/2603.09400v1/figures/methods.png)
![Автономный агент, обнаружив условие [latex]D_e \ll 1[/latex], активирует внутренний механизм, основанный на течении Дарси, предотвращая выход эффективного напряжения за пределы допустимой зоны и стабилизируя траекторию в упругой области ([latex]p^{\prime} = 8.9[/latex] МПа), в то время как модель, ограниченная литературными данными об](https://arxiv.org/html/2603.09756v1/phase3_stress_path_comparison.png)
