Когда поиск встречается с эволюцией: как большие языковые модели автоматизируют оптимизацию

Автор: Денис Аветисян


Как новый многоагентный фреймворк, использующий возможности больших языковых моделей и эволюционных алгоритмов, позволяет решать сложные задачи оптимизации в различных областях.

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу

Представлен FM Agent — многоагентная система для автоматизированной оптимизации, демонстрирующая передовые результаты на нескольких бенчмарках.

Несмотря на значительный прогресс в области искусственного интеллекта, автоматизация сложных процессов оптимизации и научных открытий остается сложной задачей. В данной работе представлена система ‘The FM Agent’, новый многоагентный фреймворк, использующий синергию больших языковых моделей и эволюционного поиска для решения широкого спектра задач. Данный подход позволяет автономно достигать передовых результатов на различных бенчмарках, включая операции исследования, машинное обучение и оптимизацию GPU-ядер. Способна ли система FM Agent стать основой для новых инструментов автоматизированных исследований и значительно ускорить темпы научных и инженерных открытий?


Агент FM функционирует посредством двух последовательных стадий – начальной, обеспечивающей быстрое развертывание, и эволюционной, направленной на оптимизацию итоговой производительности, обе из которых вносят вклад в конечный результат.
Агент FM функционирует посредством двух последовательных стадий – начальной, обеспечивающей быстрое развертывание, и эволюционной, направленной на оптимизацию итоговой производительности, обе из которых вносят вклад в конечный результат.

Преодолевая Ограничения Традиционного Поиска

Многие задачи оптимизации требуют исследования обширных пространств решений, превосходящих возможности ручных подходов. Эффективное исследование критически важно для достижения оптимальных результатов, однако традиционные методы часто оказываются непрактичными из-за вычислительной сложности. Традиционные парадигмы часто застревают в локальных оптимумах, не обнаруживая истинно оптимальные решения. Необходима новая парадигма, использующая автономных агентов для интеллектуальной навигации в сложных ландшафтах. Такой подход позволяет преодолеть ограничения традиционных методов, обеспечивая более эффективное исследование пространства решений и обнаружение глобальных оптимумов. Простое решение не обязательно короткое, оно должно быть непротиворечивым и логически завершённым.

FM Agent демонстрирует передовые возможности в решении сложных задач, основанных на эвристике, из соревнований AtCoder Completion, согласно результатам тестов на ALE-Bench Lite.
FM Agent демонстрирует передовые возможности в решении сложных задач, основанных на эвристике, из соревнований AtCoder Completion, согласно результатам тестов на ALE-Bench Lite.

FM Agent: Многоагентный Фреймворк для Автономной Оптимизации

FM Agent – новый фреймворк, основанный на принципах многоагентных систем, обеспечивающий автономное обнаружение и оптимизацию. В его основе лежат LLM-управляемые агенты, исследующие пространство решений посредством итеративного уточнения и взаимодействия. Ключевым аспектом является фаза «холодного старта», обеспечивающая широкое исследование пространства и предотвращающая преждевременную сходимость. Для поддержания баланса между исследованием и использованием, фреймворк применяет адаптивную выборку, формируя здоровую популяцию разнообразных решений, повышая устойчивость и эффективность поиска.

Оценка FM Agent на основе данных MLE-Bench показывает, что агент успешно справляется с реальными задачами машинного обучения из соревнований Kaggle, достигая высокого процента медалей.
Оценка FM Agent на основе данных MLE-Bench показывает, что агент успешно справляется с реальными задачами машинного обучения из соревнований Kaggle, достигая высокого процента медалей.

Масштабируемая Инфраструктура для Параллельной Оптимизации

Производительность FM Agent напрямую зависит от распределенной асинхронной инфраструктуры, обеспечивающей одновременную оценку и использование ресурсов. Данный подход значительно ускоряет оптимизацию и повышает надежность решений. В основе лежит фреймворк Ray, предназначенный для распределенного выполнения задач, облегчающий масштабирование и параллелизацию вычислений. Это позволяет нескольким агентам одновременно исследовать пространство решений, ускоряя процесс оптимизации и повышая устойчивость к локальным оптимумам.

Результаты проведенного анализа абляции FM Agent на задаче ahc016 показывают, что различные экспериментальные настройки влияют на производительность, при этом средние значения, рассчитанные на основе пяти независимых запусков, демонстрируют, что более высокий комбинированный результат является предпочтительным, что подтверждается стандартным отклонением.
Результаты проведенного анализа абляции FM Agent на задаче ahc016 показывают, что различные экспериментальные настройки влияют на производительность, при этом средние значения, рассчитанные на основе пяти независимых запусков, демонстрируют, что более высокий комбинированный результат является предпочтительным, что подтверждается стандартным отклонением.

Универсальность FM Agent: Валидация на Различных Бенчмарках

Агент FM успешно применен к разнообразным бенчмаркам, включая ALE-Bench, MLE-Bench и KernelBench, демонстрируя свою универсальность. На ALE-Bench агент достиг 1976.3, улучшив базовый уровень на 5.2%. На MLE-Bench агент достиг 43.56% успешности, на 4.0 процентных пункта выше базового уровня. Кроме того, агент FM эффективен в таких задачах, как генерация высококачественной речи с использованием Flow Matching Decoder. Оценки KernelBench показали, что агент FM обеспечивает ускорение от 2.08x до 20.77x по сравнению с torch.compile, демонстрируя гармоничное сочетание алгоритмической симметрии и практической необходимости.

Сравнение скорости сходимости ядер в CosyVoice2-0.5B Flow Matching Decoder с официальной реализацией на основе PyTorch показывает, что FeedForward (fusion) и SinusoidalPosEmb (unrolling) сходятся быстро, в то время как TimestepEmbedding демонстрирует более медленную сходимость, требующую исследования тайлинга общей памяти.
Сравнение скорости сходимости ядер в CosyVoice2-0.5B Flow Matching Decoder с официальной реализацией на основе PyTorch показывает, что FeedForward (fusion) и SinusoidalPosEmb (unrolling) сходятся быстро, в то время как TimestepEmbedding демонстрирует более медленную сходимость, требующую исследования тайлинга общей памяти.

Исследование, представленное в данной работе, демонстрирует элегантный подход к автоматизированной оптимизации посредством многоагентных систем. FM Agent, используя возможности больших языковых моделей и эволюционного поиска, стремится к созданию доказуемо эффективных решений. Это перекликается с высказыванием Марвина Минского: «Наиболее мощные системы не обязательно должны быть сложными, а скорее элегантными». Действительно, ключевая идея FM Agent – не просто достижение высоких результатов, а создание прозрачного и воспроизводимого процесса оптимизации, где каждый шаг может быть прослежен и обоснован. Акцент на эволюционном поиске подчеркивает стремление к нахождению оптимальных решений, а не просто к удовлетворительным, что соответствует принципам математической чистоты и доказуемости, столь важным для создания надежных и эффективных систем.

Что Дальше?

Представленный FM Agent, безусловно, демонстрирует определенную эффективность в автоматизации оптимизации. Однако, пусть N стремится к бесконечности – что останется устойчивым? Простое наращивание масштаба за счет увеличения количества агентов и сложности языковых моделей не является решением. Необходим фундаментальный пересмотр принципов взаимодействия в многоагентных системах. Существующие подходы, основанные на эвристическом поиске, неизбежно сталкиваются с проблемой экспоненциального роста сложности при увеличении размерности пространства поиска.

Особое внимание следует уделить формальной верификации алгоритмов, лежащих в основе FM Agent. Достаточно ли демонстрации успеха на нескольких бенчмарках? Необходимо доказать корректность и сходимость алгоритмов в общем случае, а не полагаться на эмпирические наблюдения. Более того, следует исследовать возможность интеграции FM Agent с другими оптимизационными подходами, такими как методы градиентного спуска и генетические алгоритмы, для создания гибридных систем, обладающих сильными сторонами каждого из них.

В конечном итоге, истинная ценность FM Agent заключается не в достижении лучших результатов на текущих задачах, а в постановке более глубоких вопросов о природе оптимизации и возможностях искусственного интеллекта. До тех пор, пока мы не сможем формально доказать устойчивость и корректность наших алгоритмов, все наши достижения останутся лишь временными компромиссами.


Оригинал статьи: https://arxiv.org/pdf/2510.26144.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-02 01:48