Автор: Денис Аветисян
Ученые представили инновационную систему, сочетающую мощь больших языковых моделей и структурированные рабочие процессы для ускорения и повышения надежности поиска новых лекарственных препаратов.

Mozi: платформа для управляемой автономии агентов искусственного интеллекта в процессе разработки лекарств, использующая графы рабочих процессов для обеспечения воспроизводимости и аудита.
Несмотря на многообещающий потенциал агентов на основе больших языковых моделей (LLM) в научных исследованиях, их применение в критически важных областях, таких как открытие лекарств, сталкивается с проблемами, связанными с неконтролируемым использованием инструментов и низкой надежностью в долгосрочной перспективе. В данной работе представлена система ‘Mozi: Governed Autonomy for Drug Discovery LLM Agents’, представляющая собой двухслойную архитектуру, объединяющую гибкость генеративного ИИ со строгой детерминированностью вычислительной биологии. Mozi обеспечивает управляемую автономию посредством иерархической системы контроля и структурированных графов рабочих процессов, что гарантирует воспроизводимость и надежность на всех этапах — от идентификации мишени до оптимизации лидирующих соединений. Способна ли эта новая парадигма превратить LLM из непредсказуемого помощника в надежного партнера-исследователя, способного эффективно решать сложные задачи в области фармацевтики?
Вызов сложности в открытии лекарств
Традиционные методы разработки лекарственных препаратов сталкиваются со значительными трудностями, проявляющимися в увеличении сроков и стоимости исследований, особенно применительно к сложным заболеваниям. Этот процесс, как правило, требует многолетних усилий и миллиардных инвестиций, при этом вероятность успешного вывода препарата на рынок остается невысокой. Основная проблема заключается в сложности биологических систем и необходимости проведения многочисленных доклинических и клинических испытаний для подтверждения эффективности и безопасности нового лекарства. Помимо этого, регуляторные требования постоянно ужесточаются, что увеличивает административную нагрузку и затягивает процесс одобрения. В результате, инновационные препараты достигают пациентов слишком медленно, а затраты на разработку продолжают расти, создавая серьезные препятствия для прогресса в борьбе со сложными недугами.
Биологические системы демонстрируют поразительную сложность, характеризующуюся нелинейными взаимодействиями между генами, белками и окружающей средой. Традиционные методы анализа, основанные на упрощенных моделях, часто оказываются неспособными адекватно отразить эту многогранность, что затрудняет понимание механизмов заболеваний и разработку эффективных терапевтических стратегий. В связи с этим, возникает потребность в более совершенных подходах к представлению знаний и логическому выводу, способных учитывать масштаб и динамичность биологических процессов. Эти подходы включают в себя создание сложных вычислительных моделей, использование машинного обучения для выявления скрытых закономерностей в больших данных и разработку систем, способных к автоматизированному рассуждению и проверке гипотез. Такие инструменты позволяют исследователям преодолеть ограничения традиционных методов и приблизиться к пониманию фундаментальных принципов жизни, открывая новые возможности для создания инновационных лекарственных препаратов.
Современные методы разработки лекарств часто сталкиваются с трудностями при решении задач, требующих долгосрочного планирования и адаптации — так называемых “задач с горизонтом планирования”. Это связано с тем, что биологические системы отличаются высокой сложностью и неопределенностью, где последствия каждого действия могут проявиться лишь спустя значительное время. Традиционные подходы, основанные на последовательном тестировании отдельных соединений, не способны эффективно учитывать эти отсроченные эффекты и динамические изменения. Исследования показывают, что для успешного преодоления этих сложностей необходимы новые алгоритмы, способные моделировать долгосрочные последствия различных терапевтических стратегий и адаптироваться к меняющимся условиям, подобно тому, как живые организмы приспосабливаются к окружающей среде. Разработка таких алгоритмов является ключевой задачей современной фармакологии и требует интеграции знаний из различных областей, включая машинное обучение, системную биологию и искусственный интеллект.
Эффективное открытие новых методов лечения требует бесшовной интеграции огромных массивов данных и умения ориентироваться в неоднозначных научных ландшафтах. Современные исследования в области биологии и медицины генерируют колоссальные объемы информации — геномные данные, протеомные профили, результаты клинических испытаний и многое другое. Однако, простого накопления этих данных недостаточно; ключевой задачей является их взаимосвязанный анализ и выявление скрытых закономерностей. Успех в этом направлении зависит от способности объединять данные из различных источников, преодолевать разнородность форматов и разрешать противоречия, часто встречающиеся в биологических системах. Именно способность к комплексному анализу и адаптации к неопределенности определяет прогресс в разработке эффективных терапевтических стратегий, позволяя преодолеть сложности, связанные с многофакторными заболеваниями и индивидуальными особенностями пациентов.

Mozi: Новая архитектура для исследований и разработок
Фреймворк Mozi представляет собой новую архитектуру, разработанную для преодоления ограничений, присущих традиционным методам и подходам, основанным на больших языковых моделях (LLM). Традиционные методы часто страдают от недостаточной автоматизации и масштабируемости, в то время как LLM, хотя и демонстрируют впечатляющие возможности генерации текста, могут быть подвержены галлюцинациям и не всегда обеспечивают надежные результаты в контексте научных исследований и разработок. Mozi направлен на решение этих проблем путем интеграции преимуществ LLM с более структурированным и контролируемым подходом, обеспечивающим воспроизводимость и надежность экспериментов, что особенно важно для научно-исследовательской деятельности.
Двухуровневая архитектура Mozi разделяет функции управления и исполнения, обеспечивая повышенную надежность и адаптивность. Уровень управления (Control Plane) отвечает за определение целей, ограничений и стратегий исследования, в то время как уровень исполнения выполняет фактические вычисления и эксперименты. Такое разделение позволяет независимо обновлять и масштабировать каждый уровень, а также внедрять механизмы контроля и проверки для обеспечения соответствия научным принципам и требованиям воспроизводимости. Независимость уровней также позволяет использовать различные инструменты и модели для каждого этапа исследовательского процесса, оптимизируя эффективность и гибкость системы.
Контрольная плоскость (Control Plane) в Mozi использует методы промпт-инжиниринга для управления процессом рассуждений большой языковой модели (LLM). Это достигается путем формирования специализированных запросов, которые направляют LLM на применение научных принципов и методологий при решении исследовательских задач. Конкретно, промпты структурируются таким образом, чтобы обеспечить соблюдение логической последовательности, проверку предположений и учет существующих научных знаний, что минимизирует риски получения неверных или необоснованных результатов. Такой подход позволяет повысить надежность и воспроизводимость экспериментов, проводимых с использованием LLM.
В основе архитектуры Mozi лежит использование графов навыков (skill graphs) для кодирования стандартизированных научных рабочих процессов. Эти графы представляют собой структурированные представления последовательностей действий, необходимых для выполнения конкретных научных задач, включая определение входных данных, промежуточных шагов и ожидаемых результатов. Такое представление позволяет не только унифицировать подходы к решению задач, но и существенно повысить воспроизводимость экспериментов, поскольку каждый шаг процесса четко определен и задокументирован. Кроме того, графы навыков обеспечивают масштабируемость, позволяя легко адаптировать и комбинировать различные рабочие процессы для решения более сложных задач, а также повторно использовать проверенные компоненты в новых исследованиях.

Выполнение рабочих процессов и целостность данных в Mozi
“Уровень рабочих процессов” (Workflow Plane) в Mozi представляет собой механизм, преобразующий абстрактные протоколы в исполняемые графы навыков (skill graphs). Это позволяет автоматизировать проведение экспериментов и анализ полученных данных за счет декомпозиции сложных задач на последовательность взаимосвязанных операций. Граф навыков определяет порядок выполнения задач, необходимые входные данные и ожидаемые результаты, обеспечивая воспроизводимость и масштабируемость экспериментальных процедур. Фактически, это позволяет реализовать исследовательский протокол как вычислительный процесс, пригодный для автоматического выполнения и анализа.
В рамках платформы Mozi ключевые этапы процесса разработки терапевтических средств — идентификация мишени, поиск лидов и оптимизация лид-соединений — реализованы как взаимосвязанные модули. Это позволяет автоматизировать последовательное выполнение стадий от определения биологической цели до получения оптимизированных соединений-кандидатов. Интеграция обеспечивает непрерывный поток данных между этапами, упрощая анализ и ускоряя процесс открытия лекарств, а также повышая воспроизводимость результатов за счет стандартизации протоколов и автоматического контроля качества данных на каждом этапе.
Система Mozi демонстрирует высокую надежность, обеспечивая 100%-ный процент успешного завершения рабочих процессов в трех сложных, многоступенчатых конвейерах для разработки лекарственных препаратов: для болезни Крона, болезни Паркинсона и сепсиса. Данный показатель свидетельствует о стабильной работе платформы при решении задач различной сложности в области поиска и оптимизации лекарственных средств, подтверждая её пригодность для автоматизированных экспериментов и анализа в процессе разработки новых терапевтических стратегий.
Оптимизированные ведущие соединения, полученные в Mozi, демонстрируют высокие показатели «лекарственности», подтверждаемые значениями QED (Quantitative Estimate of Drug-likeness) в диапазоне от 0.933 до 0.944. Кроме того, оценка синтетической доступности (Synthetic Accessibility Score) для этих соединений составляет 1.0, что указывает на высокую практическую реализуемость их синтеза в лабораторных условиях. Данные показатели свидетельствуют о благоприятных фармакокинетических и физико-химических свойствах, а также о возможности эффективного и экономичного производства потенциальных лекарственных средств.
В Mozi, управление состоянием (state management) представляет собой механизм, обеспечивающий последовательное и точное отслеживание текущего контекста эксперимента на протяжении всего рабочего процесса. Это включает в себя поддержание актуальной информации о входных данных, промежуточных результатах, параметрах модели и конфигурации каждого этапа. Система гарантирует, что все последующие операции основываются на корректном и непротиворечивом представлении текущего состояния, предотвращая ошибки, связанные с устаревшими или неверными данными. Такой подход критически важен для воспроизводимости экспериментов и надежности получаемых результатов, особенно в сложных многоступенчатых процессах, таких как разработка лекарственных препаратов.
В Mozi осуществляется тщательное отслеживание происхождения данных (data provenance), что обеспечивает надежность и прослеживаемость всех полученных результатов. Каждый этап выполнения рабочего процесса, включая входные данные, параметры, программное обеспечение и промежуточные результаты, фиксируется и сохраняется в системе. Это позволяет воспроизвести любой эксперимент, проверить валидность данных и установить связь между исходными данными и конечными выводами. Механизм отслеживания происхождения данных включает в себя сохранение метаданных о каждом этапе обработки, версионирование данных и автоматическую генерацию отчетов о происхождении данных, что критически важно для соблюдения требований регуляторных органов и обеспечения научной обоснованности полученных результатов.

Будущее инноваций в фармацевтике, основанных на ИИ
Подход, реализованный в системе Mozi, представляет собой значительный шаг вперед в автоматизации процесса формирования и проверки научных гипотез. В отличие от традиционных методов, где исследователь вручную формулирует предположения и планирует эксперименты, Mozi действует как автономный агент, способный самостоятельно генерировать гипотезы, основываясь на анализе доступных данных. Система не просто выявляет корреляции, но и стремится установить причинно-следственные связи, предлагая конкретные механизмы действия и потенциальные цели для терапевтического воздействия. Важно отметить, что проверка гипотез осуществляется не только путем моделирования, но и путем планирования и проведения виртуальных экспериментов, что позволяет значительно сократить время и ресурсы, необходимые для подтверждения или опровержения научных идей. Такой подход открывает возможности для ускорения исследований в различных областях, особенно в фармацевтике, где требуется быстрый поиск и разработка новых лекарственных препаратов.
Архитектура Mozi отличается исключительной модульностью и масштабируемостью, что позволяет беспрепятственно интегрировать разнородные источники данных и экспериментальные методики. Эта особенность позволяет системе эффективно обрабатывать информацию, полученную из геномных баз данных, протеомных исследований, клинических испытаний и даже научных публикаций, объединяя их в единую платформу для разработки лекарственных препаратов. Благодаря такому подходу, Mozi способна адаптироваться к новым типам данных и экспериментальным протоколам без необходимости полной переработки системы, значительно ускоряя и удешевляя процесс поиска перспективных кандидатов в лекарства. Гибкость и расширяемость данной архитектуры открывают возможности для создания персонализированных терапий и решения сложных задач в области биомедицинских исследований, позволяя ученым исследовать ранее недоступные комбинации данных и подходов.
Разработанная система Mozi демонстрирует способность генерировать молекулярные соединения, обладающие высоким сродством к целевым белкам, в диапазоне энергий связывания от -8.8 до -9.2 килокалорий на моль. Этот показатель свидетельствует о значительной потенциальной эффективности предложенных соединений в качестве лекарственных средств. Важно отметить, что данная способность реализована в различных терапевтических областях, что указывает на универсальность подхода и возможность применения Mozi для разработки препаратов от широкого спектра заболеваний.
Разработка Mozi открывает перспективы значительного снижения временных и финансовых затрат, связанных с процессом создания лекарственных препаратов. Традиционно, поиск и разработка новых терапевтических средств — процесс длительный и дорогостоящий, что ограничивает доступ к инновационным методам лечения для многих пациентов и медицинских учреждений. Mozi, автоматизируя ключевые этапы — от генерации гипотез до поиска молекул-кандидатов — позволяет существенно ускорить этот процесс и снизить его стоимость. Это, в свою очередь, может привести к более широкому доступу к жизненно важным лекарствам, особенно в регионах с ограниченными ресурсами и для лечения редких заболеваний, что знаменует собой важный шаг к демократизации инноваций в сфере здравоохранения.
Представленная платформа закладывает основу для нового этапа в биомедицинских исследованиях, где искусственный интеллект выступает не просто инструментом, а активным соавтором ученых. Ожидается, что подобное сотрудничество значительно ускорит процесс открытия и разработки новых лекарственных препаратов, позволяя оперативно реагировать на возникающие медицинские вызовы. Благодаря способности ИИ анализировать огромные массивы данных и выявлять закономерности, недоступные человеческому глазу, появляется возможность предсказывать эффективность соединений и оптимизировать процессы клинических испытаний. В перспективе, подобный симбиоз интеллектуальных возможностей человека и машины обещает революционизировать фармацевтическую индустрию и приблизить эру персонализированной медицины, где лечение будет максимально эффективным и адаптированным к индивидуальным особенностям каждого пациента.
Исследование, представленное в данной работе, демонстрирует стремление к созданию систем, способных к долгосрочному развитию и адаптации. В основе Mozi лежит идея управляемой автономии, где структурированные графы рабочих процессов направляют рассуждения больших языковых моделей. Это позволяет не только ускорить процесс открытия лекарств, но и обеспечить надёжность и отслеживаемость результатов. Как однажды заметила Барбара Лисков: «Программы должны быть спроектированы так, чтобы их можно было изменить без ущерба для их целостности». Принципы, заложенные в Mozi, соответствуют этой идее, поскольку система спроектирована так, чтобы изменения в отдельных компонентах не приводили к сбоям в работе всего процесса. Акцент на структурированности и управлении автономией позволяет создавать системы, которые со временем не просто стареют, а эволюционируют, сохраняя свою функциональность и надёжность.
Что Дальше?
Представленная работа, подобно любому новому инструменту, лишь обнажает горизонт нерешенных вопросов. Автономные агенты для разработки лекарств, управляемые большими языковыми моделями, — это не столько решение, сколько перенос сложности. Вместо борьбы с хаосом данных, теперь необходимо справляться с хаосом логики, заложенной в эти модели. Каждый «баг» — это момент истины во временной кривой, указывающий на хрупкость кажущейся автономии.
Очевидно, что дальнейшее развитие потребует не просто повышения точности алгоритмов, но и создания механизмов для оценки и контроля их «возраста». Технический долг, накапливающийся в сложных workflow графах, — это закладка прошлого, которую придется оплачивать настоящим, и будущее поколений этих агентов. Необходимо разработать методы «археологии» этих систем, позволяющие понять, как и почему они принимают те или иные решения.
В конечном итоге, успех этих систем будет определяться не их способностью генерировать гипотезы, а способностью выдерживать испытание временем. Всё стареет — вопрос лишь в том, делают ли они это достойно. Время — не метрика, а среда, в которой существуют системы, и именно в этой среде предстоит проверить их жизнеспособность.
Оригинал статьи: https://arxiv.org/pdf/2603.03655.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Квантовый Борьба: Китай и США на Передовой
- Интеллектуальная маршрутизация в коллаборации языковых моделей
- Квантовые симуляторы: проверка на прочность
- Квантовые нейросети на службе нефтегазовых месторождений
- Искусственный интеллект заимствует мудрость у природы: новые горизонты эффективности
2026-03-06 02:35