Самообучающиеся агенты: новый подход к глубоким исследованиям
![В рамках предложенной структуры EvoFSM, исследовательский процесс формализуется как динамический конечный автомат, инициализируемый предыдущим опытом, а затем прецизионно оптимизируется посредством атомарных операций, воздействующих как на операторы навыков [latex]\mathcal{O}\_{skill}[/latex], так и на операторы потока [latex]\mathcal{O}\_{flow}[/latex] на основе обратной связи от критика, при этом успешные и неудачные траектории дистиллируются в опыт, обеспечивая непрерывное обучение и ускорение при решении новых задач.](https://arxiv.org/html/2601.09465v1/x2.png)
Представлена система, позволяющая агентам на основе больших языковых моделей самостоятельно развиваться и оптимизировать свои навыки для проведения более эффективных и глубоких исследований.






