Мультимодальный разум: новый подход к обучению искусственного интеллекта

Исследователи предлагают единую генеративную модель, способную объединить различные визуальные навыки и демонстрировать впечатляющие результаты в решении задач, даже без обширного обучения.


![В рамках предложенной структуры EvoFSM, исследовательский процесс формализуется как динамический конечный автомат, инициализируемый предыдущим опытом, а затем прецизионно оптимизируется посредством атомарных операций, воздействующих как на операторы навыков [latex]\mathcal{O}\_{skill}[/latex], так и на операторы потока [latex]\mathcal{O}\_{flow}[/latex] на основе обратной связи от критика, при этом успешные и неудачные траектории дистиллируются в опыт, обеспечивая непрерывное обучение и ускорение при решении новых задач.](https://arxiv.org/html/2601.09465v1/x2.png)



