Автор: Денис Аветисян
В статье проводится систематический анализ передовых навыков, позволяющих языковым моделям действовать как самостоятельные агенты, выходя за рамки простого использования инструментов.

Исследование охватывает жизненный цикл, управление и формальную верификацию навыков агентов, демонстрируя их критическое влияние на производительность и надежность ИИ.
В то время как современные агенты на основе больших языковых моделей (LLM) все чаще полагаются на повторно используемые процедурные модули, систематическое понимание этого слоя остается недостаточным. В данной работе, ‘SoK: Agentic Skills — Beyond Tool Use in LLM Agents’, предпринята попытка всестороннего анализа так называемых “агентских навыков” — процедурных блоков, обеспечивающих надежное выполнение сложных задач. Авторы предлагают две взаимодополняющие таксономии, описывающие жизненный цикл навыков и их ключевые характеристики, а также рассматривают вопросы безопасности и управления, включая риски, связанные с вредоносными навыками, продемонстрированными в недавней атаке ClawHavoc. Сможем ли мы создать надежные, верифицируемые и сертифицированные навыки для автономных агентов, способных к эффективной работе в реальном мире?
По ту сторону статических моделей: рождение действенных навыков
Современные языковые модели, выступающие в роли агентов, зачастую рассматривают доступные инструменты как неизменные функции с фиксированным назначением. Это приводит к неспособности адаптироваться к меняющимся обстоятельствам и эффективно разбивать сложные задачи на более простые, последовательные шаги. Вместо гибкого использования инструментов для достижения цели, агенты склонны к однократному применению, что ограничивает их возможности в динамичных средах и препятствует решению задач, требующих творческого подхода или оптимизации. Такая ограниченность в использовании инструментов не позволяет в полной мере раскрыть потенциал языковых моделей в качестве автономных решателей проблем, поскольку они не могут самостоятельно определять оптимальную стратегию взаимодействия с инструментами для достижения наилучшего результата.
Для преодоления ограничений существующих языковых моделей, которые рассматривают инструменты как фиксированные функции, необходим переход к использованию повторно используемых процедурных модулей, именуемых “агентскими навыками”. Эти навыки представляют собой не просто последовательность действий или одноразовые рассуждения, а устойчивую, исполняемую базу знаний, позволяющую агентам эффективно декомпозировать сложные задачи на более простые этапы. В отличие от традиционных подходов, агентские навыки позволяют сохранять и переиспользовать проверенные решения, значительно повышая эффективность и надежность работы агента в различных ситуациях. Такой подход открывает путь к созданию более интеллектуальных и адаптивных систем, способных к самостоятельному обучению и решению задач, требующих сложной последовательности действий и постоянной адаптации к меняющимся условиям.
В отличие от одноразовых планов или отдельных шагов логического вывода, так называемые “агентские навыки” представляют собой устойчивую и исполняемую базу знаний. Эти навыки не просто описывают последовательность действий для решения конкретной задачи, а являются самодостаточными модулями, способными к многократному использованию и адаптации в различных контекстах. Они функционируют как программные компоненты, обладающие собственной внутренней логикой и способные взаимодействовать друг с другом, формируя сложные поведенческие паттерны. Вместо того чтобы каждый раз заново продумывать решение, агент может обращаться к этим предварительно разработанным навыкам, значительно повышая эффективность и скорость выполнения задач, а также обеспечивая большую гибкость и надежность в динамично меняющейся среде. Такой подход позволяет создавать агентов, способных не просто реагировать на запросы, но и активно обучаться и совершенствовать свои способности с течением времени.

Жизненный цикл навыка: от обнаружения до внедрения
Модель “Жизненного цикла навыка” определяет последовательность этапов, через которые проходит любой навык: обнаружение (discovery), дистилляция (distillation), хранение (storage), извлечение (retrieval), выполнение (execution), композиция (composition) и оценка (evaluation). Данная модель предполагает, что навык возникает как результат идентификации потребности или возможности, затем упрощается и структурируется для эффективного хранения, после чего может быть извлечен и применен для решения конкретной задачи. Композиция подразумевает объединение нескольких навыков для достижения более сложной цели, а оценка — анализ результатов выполнения для улучшения и адаптации навыка к изменяющимся условиям. Последовательное прохождение этих этапов позволяет оптимизировать процесс приобретения и использования навыков.
Обнаружение навыков, или выявление новых умений, может осуществляться как посредством методов автономного обучения, таких как самообучающаяся генерация, так и через идентификацию повторяющихся паттернов в задачах. Самообучающаяся генерация позволяет системе самостоятельно находить и осваивать навыки, не требуя явного программирования. В свою очередь, анализ повторяющихся паттернов задач позволяет выявить общие компоненты и алгоритмы, которые могут быть формализованы и использованы как новые навыки. Оба подхода способствуют автоматизации процесса обнаружения навыков и расширению возможностей системы без непосредственного вмешательства человека.
Эффективное хранение и извлечение навыков обеспечивается за счет использования систем индексации и определенных шаблонов проектирования. Индексация позволяет быстро находить необходимые навыки по запросу, а шаблоны проектирования, такие как раскрытие метаданных (предоставление информации о навыке, например, его назначении, входных данных и ожидаемых результатах), облегчают понимание и повторное использование. Распространение навыков через специализированные площадки (маркетплейсы) позволяет обеспечить доступ к ним широкому кругу пользователей и систем, способствуя масштабированию и обмену опытом. Правильная организация хранения и доступа к навыкам критически важна для создания гибких и адаптивных систем искусственного интеллекта.
Совершенствование навыков посредством итеративного выполнения и анализа ошибок является ключевым фактором адаптации к изменяющимся условиям и повышения производительности. Процесс включает в себя последовательное применение навыка в различных контекстах, выявление неэффективностей или ошибок в процессе выполнения, и внесение корректировок на основе полученного опыта. Такой подход позволяет системе или агенту не только поддерживать функциональность в динамичной среде, но и оптимизировать свои действия, повышая точность, скорость и эффективность выполнения задач. Итеративный характер совершенствования навыков предполагает постоянный цикл обучения и адаптации, обеспечивающий устойчивость и конкурентоспособность в долгосрочной перспективе.

Подтверждение и управление навыками агентов
Перед развертыванием навыки необходимо подвергать тщательной верификации для обеспечения корректности и предотвращения непредвиденных последствий. Этот процесс включает в себя всестороннее тестирование с использованием разнообразных входных данных и сценариев, направленное на выявление ошибок, нежелательного поведения или потенциальных уязвимостей. Верификация должна охватывать не только функциональную корректность, но и соответствие этическим нормам и требованиям безопасности. Отсутствие предварительной проверки может привести к непредсказуемым результатам, включая ошибки в работе, утечку данных или нарушение установленных правил.
После развертывания агентов, непрерывная оценка их работы является критически важной для поддержания эффективности и выявления областей для улучшения. Для этой цели целесообразно использовать детерминированные бенчмарки — стандартизированные наборы задач с известными решениями — позволяющие объективно измерить производительность агента и отследить динамику изменений во времени. Непрерывный мониторинг позволяет своевременно обнаруживать снижение производительности, вызванное, например, изменением входных данных или появлением новых требований, и оперативно вносить необходимые корректировки в навыки агента или его конфигурацию. Регулярное проведение оценок и анализ полученных результатов обеспечивают возможность постоянной оптимизации и повышения надежности агентов в реальных условиях эксплуатации.
Механизмы управления навыками (skill governance) играют ключевую роль в обеспечении безопасности, контроле доступа и соблюдении этических норм при работе с агентами. Это включает в себя строгую аутентификацию и авторизацию для предотвращения несанкционированного использования навыков, а также внедрение политик, ограничивающих доступ к конфиденциальным данным или операциям. Кроме того, необходимо обеспечить соответствие навыков действующим нормативным требованиям и этическим принципам, что может включать в себя аудит, ведение журналов и возможность отзыва или изменения навыков в случае обнаружения нарушений или рисков. Эффективное управление навыками является необходимым условием для ответственного и безопасного развертывания агентов в различных сферах применения.
Результаты тестирования показали, что использование тщательно отобранных (curated) навыков для агентов повышает процент успешного выполнения задач в среднем на 16.2 процентных пункта на разнообразном наборе тестов. В то же время, навыки, сгенерированные самостоятельно (self-generated), приводят к снижению эффективности на 1.3%. Данные свидетельствуют о необходимости контроля качества и предварительной верификации навыков, предоставляемых агентам, для обеспечения стабильно высоких показателей производительности и избежания ухудшения результатов.

К автономным и адаптивным агентам
Переход к агентам, основанным на активных навыках и надежном жизненном цикле, знаменует собой отход от статических моделей и открывает путь к истинной автономии. Вместо жестко заданных параметров, такие агенты способны самостоятельно приобретать, совершенствовать и применять навыки для решения широкого спектра задач. Этот подход позволяет им не только адаптироваться к меняющимся обстоятельствам, но и обобщать полученный опыт, значительно снижая потребность в огромных объемах обучающих данных и постоянном вмешательстве человека. В результате, создаются системы, способные к самообучению и самостоятельной деятельности, что является ключевым шагом на пути к созданию по-настоящему интеллектуальных и гибких агентов.
Архитектура, основанная на агентских навыках, позволяет агентам обучаться, адаптироваться и обобщать полученные знания значительно эффективнее, что приводит к снижению зависимости от огромных объемов данных и вмешательства человека. Вместо необходимости в непрерывном обучении на колоссальных датасетах, агенты способны самостоятельно осваивать новые задачи, используя уже приобретенные навыки и адаптируя их к меняющимся условиям. Такой подход не только повышает автономность системы, но и снижает затраты на ее поддержание и обучение, открывая перспективы для внедрения интеллектуальных агентов в различные сферы деятельности, где доступ к большим данным ограничен или невозможен.
Исследования показали заметные улучшения в производительности агентов при использовании тщательно подобранных навыков в конкретных областях. В частности, в сфере здравоохранения наблюдалось увеличение эффективности на 51,9%, а в производственном секторе — на 41,9%. Эти результаты демонстрируют, что целенаправленное развитие и применение навыков, адаптированных к специфическим задачам, позволяет существенно повысить производительность и снизить потребность в обширных обучающих данных, открывая путь к созданию более автономных и эффективных систем.
Исследования показали, что навыки, обладающие умеренной сложностью — состоящие из двух или трех модулей — демонстрируют значительное превосходство в производительности. В частности, зафиксировано увеличение эффективности на 18.6% по сравнению с навыками, как с чрезмерно упрощенной, так и с излишне сложной структурой. Этот результат указывает на оптимальный баланс между специализацией и обобщением, позволяющий агентам более эффективно решать задачи и адаптироваться к изменяющимся условиям. Оптимальная сложность навыков позволяет избежать избыточной детализации, которая замедляет процесс обучения, и одновременно обеспечивает достаточную гибкость для решения широкого спектра задач.

Наблюдения за развитием LLM-агентов неизбежно приводят к мысли о цикличности технологического долга. Статья, систематизируя понятие «агентских навыков», как бы пытается приручить хаос, структурировать процедурные знания, чтобы агенты не просто использовали инструменты, а действительно обладали навыками. Но даже самая продуманная система управления навыками, их жизненный цикл и формальная верификация, не застрахует от того, что в продакшене всё сломается самым непредсказуемым образом. Как метко подметил Дональд Кнут: «Прежде чем оптимизировать код, убедитесь, что он работает». Иначе говоря, прежде чем строить сложные системы управления навыками, нужно убедиться, что базовые навыки вообще работают стабильно. В противном случае, всё это — лишь иллюзия порядка, временно маскирующая растущий технический долг.
Куда Ведет Эта Дорога?
Представленная систематизация «агентских навыков» неизбежно обнажает не столько новые возможности, сколько старые проблемы, переодетые в современные одежды. Формальная верификация процедурного знания — благородная цель, но каждый, кто сталкивался с производственным кодом, знает: любая «гарантия» рано или поздно потребует обходных путей. Архитектура навыков — это не схема, а компромисс, переживший деплой, и любые попытки создать идеально модульный и переиспользуемый компонент обречены на столкновение с жестокой реальностью эксплуатации.
Настоящий вызов заключается не в изобретении новых навыков, а в управлении энтропией существующих. «Жизненный цикл» навыка — это не линейный процесс, а скорее цикл рефакторинга, в котором «мы» не рефакторим код — «мы» реанимируем надежду. Особое внимание следует уделить не «открытию» навыков, а их постепенному «оптимизированию» — а значит, и их неизбежной последующей «оптимизации обратно».
В конечном итоге, вся эта работа лишь подчеркивает: каждая «революционная» технология завтра станет техдолгом. Настоящая ценность — в понимании этого факта и создании систем, способных адаптироваться к неизбежному усложнению и постоянной эволюции процедурного знания.
Оригинал статьи: https://arxiv.org/pdf/2602.20867.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Функциональные поля и модули Дринфельда: новый взгляд на арифметику
- Квантовая самовнимательность на службе у поиска оптимальных схем
- Виртуальная примерка без границ: EVTAR учится у образов
- Реальность и Кванты: Где Встречаются Теория и Эксперимент
- Квантовый скачок: от лаборатории к рынку
2026-02-26 01:05