Автор: Денис Аветисян
Новый подход к поиску архитектур нейронных сетей, использующий взаимодействие нескольких агентов для повышения эффективности и снижения вычислительных затрат.

В статье представлен ArchPilot — многоагентный фреймворк, который разделяет процессы генерации кода, оценки и оркестровки для исследования более широкого пространства решений при ограниченных вычислительных ресурсах.
Несмотря на успехи LLM-агентов в автоматизированном проектировании машинного обучения, их эффективность часто ограничивается высокими вычислительными затратами и медленной итерацией. В данной работе представлена система ‘ArchPilot: A Proxy-Guided Multi-Agent Approach for Machine Learning Engineering’, использующая многоагентный подход для оптимизации архитектур нейронных сетей. ArchPilot сочетает генерацию архитектур, прокси-оценку и адаптивный поиск, позволяя исследовать большее пространство решений при ограниченных вычислительных ресурсах. Сможет ли данная архитектура стать основой для более эффективного и доступного автоматизированного машинного обучения?
Вычислительная Сложность и Поиск Оптимальной Архитектуры
Традиционный поиск нейронных архитектур (NAS) ограничен высокой вычислительной сложностью, препятствующей его практическому применению. Оценка огромного числа кандидатов требует значительных ресурсов для обучения и валидации. Существующие методы часто полагаются на трудоемкую переподготовку или используют суррогатные метрики, что может привести к выбору неоптимальных архитектур. Необходим NAS-фреймворк, способный быстро оценивать кандидатов и эффективно исследовать разнообразные архитектуры, сохраняя высокое качество найденных решений. Что останется неизменным в стремлении к поиску устойчивой архитектуры, если число кандидатов стремится к бесконечности?
ArchPilot: Трехкомпонентная Система Автоматизированного Проектирования
ArchPilot использует трехкомпонентную систему агентов: генерации, оценки и оркестровки, автоматизируя процесс проектирования нейронных сетей. Агент генерации создает разнообразные архитектуры, охватывая широкое пространство решений. Агент оценки быстро оценивает их потенциал, используя метрики производительности и эффективности. Агент оркестровки координирует процесс поиска, применяя алгоритм Монте-Карло поиска по дереву (MCTS), эффективно исследуя пространство архитектур и сосредотачиваясь на наиболее перспективных направлениях.
Быстрая Оценка с Использованием Прокси-Сигналов
Агент оценки использует метод Multi-Proxy Evaluation для оперативной оценки моделей с помощью недорогих прокси-сигналов, избегая затратных полных тренировок. Применяются два этапа: Proxy Training для первоначальной оценки и Full Training для более точной валидации при необходимости.

Для адаптивного взвешивания прокси-сигналов используется метод Ridge-Regularized Least Squares, повышающий точность предсказаний и устойчивость модели к изменениям данных. Регуляризация предотвращает переобучение.
Динамический Поиск с MCTS и Перезапуском Дерева
Агент оркестровки использует алгоритм Монте-Карло поиска по дереву (MCTS) для интеллектуального исследования пространства архитектур. MCTS оценивает различные конфигурации, выбирая наиболее перспективные варианты. В основе алгоритма лежит принцип Верхней доверительной границы для деревьев (UCB), обеспечивающий баланс между исследованием и эксплуатацией. Механизм Tree Restart обновляет процесс поиска в случае изменения семантики оценки, предотвращая стагнацию и адаптируясь к новым условиям.
Валидация и Производительность ArchPilot
ArchPilot протестирован на бенчмарке MLE-Bench, включающем 75 задач машинного обучения. Результаты демонстрируют превосходство над сильными базовыми линиями, такими как AIDE и ML-Master. Средний показатель Above-Median Rate для ArchPilot составляет 0.66, что означает, что система опережает 66% участников. Надежность ArchPilot выше, чем у ML-Master (0.893 против 0.867 по показателю валидных отправленных решений). ArchPilot достигает Mean Normalized Ranking в 0.6149, превосходя показатель ML-Master (0.6535).
В представленной работе исследователи демонстрируют стремление к поиску оптимальных архитектур нейронных сетей, используя многоагентный подход ArchPilot. Этот метод, разделяющий процессы генерации кода, оценки и оркестровки, позволяет исследовать более широкое пространство решений при ограниченных вычислительных ресурсах. В этом контексте, уместно вспомнить слова Блеза Паскаля: “Все проблемы человечества происходят от того, что люди не умеют спокойно сидеть в комнате одни.” Именно стремление к упрощению и элегантности, к поиску наиболее эффективного решения, является ключевым принципом ArchPilot, подобно тому, как Паскаль призывает к внутренней гармонии и избежанию ненужной сложности. Подход, направленный на эффективное использование ресурсов для достижения оптимального результата, отражает математическую чистоту, к которой стремится данное исследование.
Что впереди?
Представленный подход, безусловно, демонстрирует эффективность в расширении пространства поиска архитектур нейронных сетей. Однако, следует признать, что сама постановка задачи – поиск “лучшей” архитектуры – остается, в некотором смысле, элегантным заблуждением. Эффективность алгоритма ArchPilot не отменяет фундаментальной неопределенности, присущей процессу обучения; корректность найденной архитектуры определяется лишь на конечном наборе данных, а экстраполяция на невидимые данные всегда несет в себе риск.
Будущие исследования, вероятно, должны сосредоточиться не столько на увеличении скорости поиска, сколько на разработке более надежных метрик оценки. Замена прокси-оценки на более точную, но вычислительно затратную, может оказаться более плодотворной, чем бесконечная оптимизация скорости. Иными словами, необходимо стремиться к математической чистоте оценки, а не просто к быстрому перебору вариантов.
В конечном счете, истинный прогресс заключается в отказе от поиска “идеальной” архитектуры в пользу создания систем, способных адаптироваться и эволюционировать в ответ на изменяющиеся данные. Поиск прекрасен, но адаптация – вот что отличает действительно элегантное решение от просто работающего.
Оригинал статьи: https://arxiv.org/pdf/2511.03985.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Виртуальная примерка без границ: EVTAR учится у образов
- Искусственный интеллект и рефакторинг кода: что пока умеют AI-агенты?
- Почему ваш Steam — патологический лжец, и как мы научили компьютер читать между строк
- LLM: математика — предел возможностей.
- Квантовый прыжок: сможем ли мы наконец разгадать тайну сворачивания белков?
- Эмоциональный отпечаток: Как мы научили ИИ читать душу (и почему рейтинги вам врут)
- Восполняя пробелы в знаниях: Как языковые модели учатся делать выводы
- Память как основа разума: новый подход к генерации ответов
- Квантовый скачок из Андхра-Прадеш: что это значит?
- Разделяй и властвуй: Новый подход к классификации текстов
2025-11-09 21:01