Самообучающиеся научные команды: новый подход к долгосрочным экспериментам

Автор: Денис Аветисян

В статье представлена система, позволяющая создавать и координировать группы ИИ-агентов для автоматизации и ускорения научных исследований, особенно в областях, требующих длительных и сложных экспериментов.

Самоорганизующиеся группы агентов, представленные в исследовании, способны автономно определять перспективные направления исследований, формировать команды и параллельно проводить эксперименты, демонстрируя подход к автоматизации длительных исследовательских процессов.

AutoScientists — это самоорганизующаяся многоагентная система, обеспечивающая передовые результаты в задачах оптимизации долгосрочных научных экспериментов, включая биомедицинское машинное обучение и инженерные исследования белков.

Научный поиск часто ограничен последовательным подходом к проверке гипотез и неэффективным использованием вычислительных ресурсов. В работе «AutoScientists: Self-Organizing Agent Teams for Long-Running Scientific Experimentation» представлена система, состоящая из самоорганизующихся агентов, способных к параллельному исследованию и адаптации стратегий в долгосрочных экспериментах. Показано, что AutoScientists превосходит существующие подходы в задачах биомедицинского машинного обучения, оптимизации обучения языковых моделей и предсказания пригодности белков, достигая, например, улучшения на +12.5% в корреляции Спирмена для оценки связывания ACE2-Spike. Сможет ли подобный децентрализованный подход кардинально ускорить темпы научных открытий в различных областях?

Зачем нам предсказывать белок, если он и так сломается?

Точное предсказание эффектов вариантов белка имеет решающее значение для прогресса в разработке лекарств и материаловедении, однако эта задача остается сложной. Белки, как фундаментальные строительные блоки жизни, обладают невероятным разнообразием, и даже незначительные изменения в их аминокислотной последовательности могут существенно повлиять на их функцию и стабильность. Понимание этих последствий — ключевой фактор в создании новых терапевтических средств и материалов с заданными свойствами. Сложность заключается в огромном количестве возможных мутаций и многомерности взаимодействий внутри белковой структуры, что делает традиционные методы прогнозирования недостаточно эффективными и требующими значительных вычислительных ресурсов. Неспособность точно предсказывать эффекты вариантов ограничивает скорость и успех инноваций в этих критически важных областях науки и техники.

Традиционные методы предсказания эффектов белков сталкиваются с существенными трудностями, обусловленными как внутренней сложностью аминокислотных последовательностей, так и колоссальным разнообразием возможных мутаций. Белковые структуры, определяющие их функции, зависят от тонкого баланса взаимодействий между сотнями, а иногда и тысячами атомов. Даже незначительное изменение в последовательности может привести к каскаду структурных перестроек и, как следствие, к непредсказуемым изменениям в активности или стабильности белка. При этом, количество потенциальных мутаций практически бесконечно, что делает исчерпывающий анализ всех вариантов невозможным. Существующие вычислительные подходы часто ограничены в способности адекватно моделировать все эти сложные взаимодействия и, следовательно, демонстрируют низкую точность при предсказании эффектов новых, ранее не изученных мутаций.

Необходимость в масштабируемых и устойчивых прогностических моделях стимулирует разработку новых подходов в области предсказания эффектов вариантов белков. Традиционные методы, часто сталкивающиеся с трудностями при обработке огромного разнообразия возможных мутаций и сложностью белковых последовательностей, уступают место алгоритмам, способным эффективно анализировать большие объемы данных и адаптироваться к новым открытиям. Разработка таких моделей требует интеграции передовых методов машинного обучения, включая глубокие нейронные сети и методы ансамблевого обучения, для повышения точности предсказаний и обеспечения их надежности в различных условиях. Особое внимание уделяется созданию моделей, способных к непрерывному обучению и самосовершенствованию, что позволит значительно ускорить процессы разработки лекарственных препаратов и материалов с заданными свойствами.

Существующие методы предсказания свойств белков часто демонстрируют ограниченную способность к адаптации и непрерывному обучению на новых данных. В отличие от биологических систем, которые эволюционируют и совершенствуются со временем, большинство вычислительных моделей остаются статичными после первоначальной тренировки. Это означает, что при появлении новых экспериментальных данных, отражающих, например, влияние ранее неизвестных мутаций или специфические условия окружающей среды, точность предсказаний может значительно снижаться. Отсутствие механизмов для интеграции новой информации и переоценки существующих параметров ограничивает потенциал этих методов в долгосрочной перспективе, особенно в контексте быстро развивающейся геномики и протеомики. Разработка алгоритмов, способных к самообучению и адаптации к меняющимся данным, является ключевой задачей для повышения надежности и эффективности предсказания свойств белков.

Модель предсказания блокировки hERG, разработанная AutoScientists, представлена в виде карточки модели.

Автоматизированная наука: Зачем тратить время, если это могут сделать машины?

AutoScientists представляет собой систему, состоящую из команды автономных агентов, предназначенную для проведения научных экспериментов, рассчитанных на длительный период времени. Ключевой особенностью архитектуры является отсутствие централизованного управления или координатора; агенты взаимодействуют и координируют свои действия посредством обмена информацией и самоорганизации. Данный подход позволяет системе адаптироваться к меняющимся условиям эксперимента, эффективно распределять ресурсы и поддерживать непрерывный цикл гипотез, экспериментов и анализа данных без необходимости внешнего вмешательства или ручного управления процессом.

Общее состояние (Shared State) в системе AutoScientists представляет собой централизованное хранилище данных, обеспечивающее согласованность и обмен информацией между агентами. Оно содержит результаты экспериментов, текущие гипотезы, метаданные о проведенных исследованиях и другую релевантную информацию. Агенты получают доступ к общему состоянию для оценки прогресса, избежания дублирования усилий и координации своих действий. Обновления общего состояния происходят посредством асинхронных операций записи, что позволяет агентам оперативно обмениваться данными без централизованного управления. Структура общего состояния оптимизирована для быстрого доступа и эффективного хранения больших объемов данных, необходимых для поддержки долгосрочных научных исследований.

Система AutoScientists использует принципы самоорганизации для адаптации к изменяющимся условиям и оптимизации дизайна экспериментов. Это достигается за счет децентрализованного взаимодействия агентов, где каждый агент действует автономно, основываясь на локальной информации и результатах предыдущих экспериментов. Вместо централизованного управления, система полагается на emergent поведение, возникающее из коллективного взаимодействия агентов. Агенты динамически перестраивают свою деятельность, основываясь на обратной связи от окружающей среды и других агентов, что позволяет системе эффективно исследовать пространство параметров и находить оптимальные экспериментальные стратегии без необходимости явного программирования или ручного вмешательства. Такая децентрализованная архитектура повышает устойчивость системы к сбоям и позволяет ей адаптироваться к неожиданным изменениям в условиях эксперимента.

Система AutoScientists обеспечивает проведение экспериментов в долгосрочной перспективе за счет поддержания и эволюции гипотез на протяжении продолжительных периодов времени. В отличие от традиционных подходов, где гипотезы часто пересматриваются или отбрасываются после каждого цикла эксперимента, AutoScientists сохраняет информацию о предыдущих результатах и использует её для уточнения и адаптации текущих гипотез. Это позволяет системе накапливать знания, выявлять сложные взаимосвязи и проводить исследования, требующие длительного наблюдения и анализа, например, в области материаловедения или биологии. Процесс эволюции гипотез включает в себя оценку их соответствия новым данным, внесение корректировок на основе статистического анализа и автоматическое генерирование новых гипотез для проверки, что способствует непрерывному улучшению и расширению научного поиска.

В ходе длительных экспериментов по поиску, команда агентов AutoScientists демонстрирует спонтанную координацию, о чем свидетельствуют характерные цитаты из их взаимодействия.

Гауссовские процессы: Прогнозирование белков с учётом неопределённости (потому что всё неточно).

Ядро предсказательной системы Kermut базируется на моделировании Гауссовских процессов (Gaussian Process, GP). Гауссовские процессы представляют собой мощный непараметрический подход к регрессии и классификации, позволяющий оценивать распределение вероятностей над функциями. В контексте Kermut, GP используется для прогнозирования свойств белков, учитывая их последовательности. Ключевым преимуществом GP является возможность количественной оценки неопределенности прогнозов, что критически важно для надежности предсказаний. Модель GP в Kermut использует ядро (kernel) для определения сходства между последовательностями, что позволяет эффективно обобщать данные и делать прогнозы для ранее не встречавшихся белков. $p(y|x) = \mathcal{N}(y; \mu, \Sigma)$ , где μ и Σ определяются через ядро и обучающие данные.

В основе функционирования Kermut лежит использование признаков, сгенерированных большой языковой моделью ESM-2, для улучшения анализа последовательностей белков. ESM-2 предоставляет векторные представления последовательностей, кодирующие информацию о вероятностях аминокислот и их взаимосвязях, что позволяет Kermut более эффективно учитывать эволюционные и структурные особенности белков. Эти признаки служат входными данными для гауссовского процесса, обеспечивая более точное прогнозирование свойств и функций белков, чем при использовании только первичной последовательности аминокислот.

Модель Kermut непрерывно совершенствуется посредством автоматизированных экспериментов, управляемых системой AutoScientists. Этот процесс включает в себя систематическое проведение тестов с различными параметрами и конфигурациями модели, автоматическую оценку результатов на основе заданных метрик точности и надежности, и последующую корректировку модели на основе полученных данных. AutoScientists используют алгоритмы оптимизации для эффективного поиска наилучших параметров, что позволяет повысить точность предсказаний и устойчивость модели к различным типам входных данных и шумам. Постоянное проведение экспериментов и автоматическая оптимизация обеспечивают непрерывное улучшение характеристик Kermut.

Для повышения точности прогнозов и снижения вероятности систематических ошибок, система использует ансамблевый метод. Этот подход предполагает объединение прогнозов, полученных от нескольких независимых моделей, обученных на различных подмножествах данных или с использованием разных параметров. В результате, индивидуальные ошибки, присущие каждой отдельной модели, компенсируются, что приводит к более стабильным и надежным результатам. Использование ансамблевого метода позволяет снизить дисперсию прогнозов и повысить их обобщающую способность, особенно в случаях, когда отдельные модели демонстрируют значительные расхождения в оценках.

Анализ применения различных методов в задачах BioML-Bench показывает, что подход AutoScientists широко использует градиентный бустинг (<span class="katex-eq" data-katex-display="false">GBM</span>), предобученные модели (<span class="katex-eq" data-katex-display="false">FM-frozen</span> и <span class="katex-eq" data-katex-display="false">FM-finetune</span>), а также нейронные сети (<span class="katex-eq" data-katex-display="false">NN-scratch</span>), при этом большинство задач используют комбинацию нескольких категорий методов. — Анализ применения различных методов в задачах BioML-Bench показывает, что подход AutoScientists широко использует градиентный бустинг ( $GBM$ ), предобученные модели ( $FM-frozen$ и $FM-finetune$ ), а также нейронные сети ( $NN-scratch$ ), при этом большинство задач используют комбинацию нескольких категорий методов.

Автоматизированная наука в действии: Результаты, которые говорят сами за себя (и подтверждают нашу правоту).

Система AutoScientists демонстрирует передовые результаты в различных научных бенчмарках, превзойдя существующие AI-агенты на 8.33 процентных пункта на рейтинговой таблице BioML-Bench, достигнув показателя в 74.40%. Данное достижение свидетельствует о значительном прогрессе в автоматизированном научном открытии и подтверждает эффективность предложенного подхода к решению сложных биомолекулярных задач. Такой результат не только устанавливает новый стандарт производительности, но и открывает перспективы для более быстрого и точного моделирования биологических процессов, что может способствовать разработке новых лекарственных препаратов и углублению понимания фундаментальных принципов жизни.

Для строгой оценки эффективности Kermut и отслеживания динамики его развития, система AutoScientists активно использует платформы BioML-Bench и ProteinGym. Эти специализированные бенчмарки позволяют проводить всестороннее тестирование модели в различных задачах биомолекулярного моделирования, обеспечивая надежные и воспроизводимые результаты. Регулярное прохождение тестов на BioML-Bench и ProteinGym не только демонстрирует прогресс в улучшении алгоритмов, но и позволяет выявлять потенциальные слабые места, направляя дальнейшие усилия по оптимизации. Такой подход к оценке гарантирует, что Kermut постоянно совершенствуется и адаптируется к новым вызовам в области биоинформатики, что подтверждается достигнутыми показателями эффективности.

Для обеспечения надежности и применимости полученных результатов, система AutoScientists использует метод перекрестной проверки — кросс-валидацию. Этот подход позволяет оценить способность модели к обобщению, то есть к корректной работе с данными, которые не использовались в процессе обучения. В ходе кросс-валидации исходный набор данных разделяется на несколько подмножеств, и модель последовательно обучается на одних подмножествах, а затем проверяется на остальных. Это позволяет выявить переобучение — ситуацию, когда модель слишком хорошо запоминает обучающие данные, но плохо работает с новыми. Благодаря кросс-валидации, AutoScientists гарантирует, что полученные модели не просто «заучивают» информацию, а действительно способны к прогнозированию и анализу, что критически важно для надежности научных исследований.

В рамках системы AutoScientists постоянно поддерживается так называемая “Чемпионская модель” — наиболее эффективная версия алгоритма, продемонстрировавшая лучшие результаты на текущий момент. Эта модель служит эталоном, с которым сравниваются все последующие итерации и усовершенствования. Постоянное отслеживание и обновление “Чемпионской модели” позволяет гарантировать, что система всегда использует самые передовые методы и достигает максимальной производительности в решении поставленных задач, например, в прогнозировании взаимодействия белков или в оптимизации параметров моделей машинного обучения. Данный подход обеспечивает стабильное улучшение результатов и позволяет AutoScientists поддерживать лидирующие позиции в области автоматизированного научного поиска.

В ходе тестирования на платформе ProteinGym, система AutoScientists продемонстрировала значительное улучшение в прогнозировании взаимодействия между белками ACE2 и Spike. Показатель точности, оцениваемый на основе данного бенчмарка, вырос с 0.747 до 0.840. Данный прогресс свидетельствует о повышенной способности системы моделировать сложные молекулярные взаимодействия, что особенно важно для разработки новых лекарственных препаратов и понимания механизмов вирусных инфекций. Улучшенная точность предсказания позволяет более эффективно идентифицировать перспективные молекулы-кандидаты и сократить время, необходимое для проведения дорогостоящих лабораторных исследований.

Система AutoScientists продемонстрировала заметное преимущество в эффективности обучения, достигнув аналогичной промежуточной валидационной ошибки в процессе обучения GPT nanochat всего за 34 эксперимента, в то время как система Autoresearch потребовала 65 экспериментов для достижения того же результата. Это указывает на более рациональное использование вычислительных ресурсов и ускоренную конвергенцию модели, что позволяет сократить время и затраты на разработку. Такая оптимизация в количестве необходимых экспериментов существенно влияет на практическую применимость и масштабируемость системы AutoScientists для решения более сложных задач машинного обучения.

Система AutoScientists использует алгоритм градиентного спуска для оптимизации параметров моделей, что позволяет значительно повысить точность предсказаний. В ходе валидации удалось достичь показателя в 0.9730 бит на байт, что свидетельствует о высокой эффективности сжатия информации и, следовательно, о более точных моделях. Примечательно, что в аналогичных исследованиях, проведенных Autoresearch, не удалось добиться каких-либо подтвержденных улучшений этого показателя, что подчеркивает превосходство AutoScientists в оптимизации и достижении высокой предсказательной силы.

AutoScientists демонстрирует улучшение производительности на задачах BioML-Bench, превосходя медианный уровень публичной таблицы лидеров и получая медали по результатам оценки на 24 биомедицинских задачах (стандартная ошибка представлена на графике, подробные данные в TableS6).

Автоматизация науки, как показывает проект AutoScientists, неизбежно приводит к формированию самоорганизующихся систем. Команды агентов, стремящиеся к оптимизации долгосрочных экспериментов, напоминают скорее рой термитов, чем слаженную научную группу. Всё это — лишь закономерный этап эволюции, где элегантность алгоритма уступает место грубой эффективности. Как однажды заметил Марвин Минский: «Наиболее надежный способ предсказать будущее — это создать его». И в данном случае, создание будущего науки, похоже, означает передачу рутинной работы не людям, а алгоритмам, способным к параллельному исследованию гипотез, что, в конечном итоге, ведет к неизбежному техническому долгу. Но, возможно, в этом и есть прогресс — стабильное падение, по крайней мере, последовательное.

Куда же это всё ведёт?

Представленная работа, как и большинство «прорывов», скорее обозначила горизонт новых технических долгов, чем решила фундаментальную проблему. Автоматизация экспериментов, безусловно, интересна, но она лишь отодвигает неизбежное: необходимость в человеческом разуме, способном понять, почему что-то работает, а не просто что работает. Очевидно, что предложенная система AutoScientists способна генерировать результаты, но вопрос о её способности к настоящему научному открытию, к генерации нетривиальных гипотез, остаётся открытым. Тесты, как всегда, — это лишь форма надежды, а не гарантия.

Следующим этапом, вероятно, станет гонка вооружений в области сложности агентов и объёма вычислительных ресурсов. Более сложные агенты будут требовать больше данных для обучения, что, в свою очередь, породит новые проблемы с обобщением и интерпретируемостью. Вполне вероятно, что мы увидим появление систем, способных генерировать огромное количество «ложных открытий», которые потребуют значительных усилий для верификации. И, конечно, кто-нибудь обязательно попытается развернуть это в продакшн по понедельникам.

В конечном счёте, будущее этой области, скорее всего, будет определяться не столько алгоритмическими инновациями, сколько способностью объединить автоматизированные системы с человеческим опытом и интуицией. Автоматизация — это инструмент, а не замена ученому. И уж точно, не стоит ожидать, что скрипт решит все проблемы биомедицины.

Оригинал статьи: https://arxiv.org/pdf/2605.28655.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-05-29 01:42

🚀 Квантовые новости