Автор: Денис Аветисян
Новая система CASCADE позволяет агентам на базе больших языковых моделей не просто использовать инструменты, а самостоятельно приобретать и совершенствовать научные навыки, приближая автоматизацию исследовательского процесса.

Представлена платформа CASCADE, самообучающийся агент, демонстрирующий накопление навыков и автономное проведение экспериментов в научной среде.
Современные LLM-агенты зачастую ограничены предопределёнными инструментами, что препятствует адаптации к сложным научным задачам. В работе ‘CASCADE: Cumulative Agentic Skill Creation through Autonomous Development and Evolution’ представлен саморазвивающийся агентский фреймворк, демонстрирующий переход от простого использования инструментов к приобретению и накоплению научных навыков. CASCADE, используя веб-поиск и самоанализ, достигает 93.3% успеха на бенчмарке SciSkillBench, значительно превосходя системы без механизмов эволюции. Не открывает ли это путь к масштабируемым системам ИИ, способным автономно проводить научные исследования и сотрудничать с учёными?
Преодолевая Ограничения: За Гранью Простого Использования Инструментов
Современные большие языковые модели (LLM) функционируют преимущественно в рамках парадигмы “LLM + Использование Инструментов”, где их возможности ограничиваются заранее определенным набором инструментов и программ. Вместо самостоятельного освоения новых навыков, модели полагаются на внешние инструменты для выполнения задач, что снижает их адаптивность и требует постоянного вмешательства человека для определения целей и интерпретации результатов. По сути, LLM выступают в роли продвинутых интерфейсов к существующим инструментам, а не самостоятельных исследователей, что создает узкое место в процессе научных открытий и ограничивает потенциал искусственного интеллекта в решении сложных, неструктурированных задач.
Существующий подход к использованию больших языковых моделей в науке, основанный на предопределенных инструментах, создает серьезные препятствия для совершения новых открытий. Вместо самостоятельного исследования, модели требуют значительного участия человека не только для определения конкретных задач, но и для интерпретации полученных результатов. Этот процесс, требующий постоянного контроля и вмешательства, замедляет темпы научных исследований и ограничивает потенциал искусственного интеллекта, поскольку большая часть работы по анализу и осмыслению данных остается за учеными. В результате, вместо автономного помощника, модель функционирует как сложный инструмент, требующий постоянного управления и контроля со стороны исследователя.
Простое увеличение масштаба больших языковых моделей (LLM) не приведет к прорыву в области научной искусственного интеллекта. Несмотря на впечатляющие возможности в обработке и генерации текста, современные LLM ограничены рамками заранее определенных инструментов и требуют значительного участия человека для постановки задач и интерпретации полученных результатов. Для достижения подлинного научного прогресса необходим принципиально новый подход, ориентированный на автономное приобретение навыков. Искусственный интеллект будущего должен уметь самостоятельно определять исследовательские задачи, формулировать гипотезы, проводить эксперименты и анализировать данные, подобно ученому, а не просто выполнять предписанные инструкции. Такой переход требует разработки систем, способных к самообучению и адаптации, что откроет путь к автоматизированным научным открытиям и решению сложных проблем, неподвластных современным системам.
CASCADE: Параллель Приобретения Навыков
Архитектура CASCADE представляет собой парадигму “LLM + Приобретение навыков”, в которой агенты способны к обучению и совершенствованию навыков посредством непрерывного взаимодействия и самоанализа. В рамках данной парадигмы, большая языковая модель (LLM) используется не только для генерации ответов, но и для оценки собственной производительности и выявления областей для улучшения. Этот процесс включает в себя анализ ошибок, выработку стратегий для их исправления и применение этих стратегий в последующих итерациях взаимодействия. Таким образом, система не просто выполняет задачи, но и активно учится на своем опыте, повышая свою эффективность с течением времени.
В основе CASCADE лежит использование двух ключевых решателей задач: DeepSolver и SimpleSolver. DeepSolver представляет собой мощный движок, предназначенный для автономного решения сложных задач, требующих глубокого анализа и многошаговых рассуждений. В отличие от него, SimpleSolver обеспечивает быстрое решение задач, основанное на извлечении и применении знаний из базы данных или внешних источников. Комбинирование этих двух подходов позволяет системе эффективно решать широкий спектр задач, используя преимущества как глубокого анализа, так и быстрого доступа к информации. Выбор между DeepSolver и SimpleSolver осуществляется динамически, в зависимости от сложности и типа задачи.
Архитектура CASCADE предусматривает использование как сессионной, так и консолидированной памяти для обеспечения как контекстной осведомленности, так и долгосрочного обучения. Сессионная память хранит информацию, релевантную текущей итерации взаимодействия, позволяя агенту учитывать недавние события и адаптировать свои действия в рамках одного сеанса. Консолидированная память, напротив, предназначена для хранения знаний, приобретенных в ходе предыдущих взаимодействий, и служит основой для обобщения опыта и повышения эффективности агента в долгосрочной перспективе. Комбинация этих двух типов памяти позволяет CASCADE эффективно решать текущие задачи и одновременно накапливать знания для улучшения производительности в будущем.

Автономные Научные Открытия: Практическое Применение
Система CASCADE в настоящее время функционирует в составе автоматизированных лабораторий, обеспечивая автоматизацию процессов проектирования экспериментов, анализа полученных данных и итеративной оптимизации. Этот подход позволяет значительно ускорить научные исследования за счет уменьшения необходимости ручного вмешательства на каждом этапе. Автоматизация включает в себя не только сбор и обработку данных, но и самостоятельное формирование гипотез и планирование последующих экспериментов, направленных на подтверждение или опровержение этих гипотез. Подобная интеграция позволяет повысить эффективность научных исследований и снизить временные затраты на получение результатов.
Для решения сложных задач в материаловедении и химии, платформа CASCADE использует вычислительные ресурсы высокой производительности, такие как NERSC и XSEDE. Эти ресурсы обеспечивают необходимую мощность для моделирования, анализа данных и автоматизированного проектирования экспериментов. Использование инфраструктуры NERSC и XSEDE позволяет обрабатывать большие объемы данных и выполнять ресурсоемкие вычисления, необходимые для поиска новых материалов и оптимизации химических процессов. Такая архитектура позволяет CASCADE эффективно масштабироваться для решения задач, требующих значительных вычислительных мощностей, и обеспечивает высокую скорость обработки данных.
Функциональные возможности DeepSolver усилены за счет использования языка программирования Python и моделей OpenAI, что обеспечивает надежную и масштабируемую платформу для научных исследований. Python предоставляет гибкость и широкую библиотеку инструментов для обработки данных и автоматизации экспериментов, в то время как интеграция с моделями OpenAI, такими как GPT-5, позволяет выполнять сложные задачи, включая генерацию гипотез, анализ результатов и планирование дальнейших исследований. Такая комбинация технологий обеспечивает высокую производительность и адаптивность системы к различным научным задачам, позволяя автоматизировать значительную часть исследовательского процесса.
В ходе тестирования на бенчмарке SciSkillBench система CASCADE продемонстрировала общий процент успешного выполнения задач на уровне 70%, что превосходит показатели базовых моделей. На задачах уровня 0 система достигает 100% точности Pass@3 при использовании моделей GPT-5, O3 и GPT-5-mini. Отмечается, что в отличие от моделей S&D, Native и Claude Code, CASCADE демонстрирует более медленное снижение производительности при увеличении сложности решаемых задач, что указывает на её повышенную устойчивость к трудностям в процессе научных исследований.

Будущее Научных Исследований, Управляемых ИИ
Система CASCADE представляет собой качественно новый подход к научным исследованиям, где искусственный интеллект берет на себя рутинные задачи, такие как сбор и предварительная обработка данных, а также проведение базового анализа. Это позволяет ученым высвободить время и ресурсы для концентрации на творческих аспектах работы — формулировании гипотез, интерпретации результатов и разработке инновационных подходов. Благодаря способности ИИ выявлять закономерности и предоставлять глубокую аналитику, CASCADE выступает не заменой ученому, а его мощным инструментом, расширяющим возможности для прорывных открытий в различных областях науки — от материаловедения до химии и за ее пределами. Такой симбиоз человеческого интеллекта и вычислительной мощи открывает перспективы для ускорения научных исследований и решения сложных задач, ранее казавшихся недостижимыми.
Система CASCADE обладает уникальной способностью к непрерывному обучению, что обеспечивает её адаптивность и устойчивость к меняющимся научным задачам. В отличие от традиционных алгоритмов, требующих постоянной перенастройки человеком, CASCADE самостоятельно анализирует результаты экспериментов и моделирования, выявляя закономерности и совершенствуя свои методы. Этот процесс самообучения позволяет системе не только оптимизировать текущие исследования, но и предвидеть будущие вызовы, приобретая навыки, необходимые для решения новых, ранее не встречавшихся проблем. Благодаря этому, CASCADE способна эффективно функционировать в динамично меняющейся научной среде, обеспечивая непрерывный прогресс даже перед лицом непредвиденных обстоятельств и сложных задач, требующих постоянной адаптации и инноваций.
Система CASCADE призвана значительно ускорить темпы научных открытий в различных областях, автоматизируя рутинные этапы исследовательского процесса. Благодаря этому, ученые получают возможность сосредоточиться на постановке новых задач и интерпретации результатов, что особенно важно в таких дисциплинах, как материаловедение и химия. Автоматизация позволяет проводить масштабные вычислительные эксперименты и анализировать огромные объемы данных, выявляя закономерности, которые могли бы остаться незамеченными при традиционном подходе. Ожидается, что внедрение CASCADE приведет к разработке новых материалов с улучшенными свойствами, созданию инновационных химических соединений и, в конечном итоге, к прорывам в фундаментальной науке и прикладных технологиях.

Исследование, представленное в данной работе, демонстрирует стремление к созданию систем, способных к самостоятельному развитию и накоплению навыков. Авторы, разрабатывая CASCADE, фокусируются на принципах минимизации избыточности и оптимизации процессов, что находит отражение в архитектуре системы. Как однажды заметил Линус Торвальдс: «Совершенство достигается не когда нечего добавить, а когда нечего убрать». Данный подход особенно актуален в контексте самообучающихся агентов, где каждый дополнительный элемент, не вносящий вклада в основную задачу, усложняет систему и снижает её эффективность. CASCADE, стремясь к созданию кумулятивных навыков, демонстрирует важность «красоты компрессии без потерь» в проектировании интеллектуальных систем.
Что Дальше?
Представленная работа демонстрирует, что автоматизированное накопление научных навыков возможно. Однако, абстракции стареют. Текущая архитектура, хоть и функциональна, ограничена скоростью и эффективностью эволюции. Ключевая проблема — не в самом использовании инструментов, а в способности агента к самостоятельной оценке значимости приобретенных навыков. Простое накопление — это не прогресс, это архив.
Каждая сложность требует алиби. Необходимо переосмыслить метрики успеха. Текущие бенчмарки измеряют лишь скорость выполнения заданий, игнорируя качество гипотез и глубину понимания. Следующим шагом видится создание систем, способных к критической самооценке, к выявлению собственных ошибок и к адаптации стратегии не только для достижения цели, но и для уточнения самой цели.
Автономные лаборатории — это хорошо, но истинный прогресс потребует интеграции с существующей научной инфраструктурой. Необходимо разработать протоколы, позволяющие агентам не только проводить эксперименты, но и эффективно обмениваться знаниями с людьми и другими агентами. Иначе мы получим лишь еще один изолированный «черный ящик».
Оригинал статьи: https://arxiv.org/pdf/2512.23880.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Восполняя пробелы в знаниях: Как языковые модели учатся делать выводы
- Квантовый Монте-Карло: Моделирование рождения электрон-позитронных пар
- Квантовый скачок из Андхра-Прадеш: что это значит?
- Виртуальная примерка без границ: EVTAR учится у образов
- Геометрия на пределе: как алгоритмы оптимизации превосходят языковые модели
- Разгадывая тайны квантового мира: переработка кубитов и шум как тайная приправа?
- Оптимизация партийных запросов: Метод имитации отжига против градиентных подходов
- Эмоциональный отпечаток: Как мы научили ИИ читать душу (и почему рейтинги вам врут)
- Скрытая сложность: Необратимые преобразования в квантовых схемах
2026-01-01 20:09