Искусственный интеллект в поиске лекарств: где гарантия точности?

Автор: Денис Аветисян

Новое исследование оценивает возможности и ограничения моделей искусственного интеллекта, таких как Boltz-2, в предсказании взаимодействия белков и лекарственных веществ.

Согласованность сродства связывания, продемонстрированная двумя независимыми прогонами алгоритма Boltz-2 для протеазы 3CLPro и TNKS2, подтверждает надёжность и воспроизводимость моделирования взаимодействия белок-лиганд.

Оценка надежности модели Boltz-2 для предсказания структуры и энергии связывания белок-лиганд показывает, что ее точность уступает физически обоснованным методам, таким как ESMACS.

Несмотря на активное внедрение искусственного интеллекта в разработку лекарств, до настоящего момента ни один препарат, полностью созданный с использованием ИИ, не получил одобрения регулирующих органов. В данной работе, посвященной оценке надежности ИИ-методов в разработке лекарств — ‘On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction’, авторы провели всесторонний анализ нового подхода, основанного на фундаментальной модели Boltz-2, для предсказания структуры и сродства связывания протеин-лиганд. Результаты показали, что, несмотря на высокую скорость работы, точность предсказания энергии связывания Boltz-2 уступает физически обоснованным методам, таким как ESMACS, и требует дальнейшей калибровки. Каковы перспективы интеграции ИИ и методов молекулярной динамики для создания действительно надежных и эффективных алгоритмов поиска новых лекарственных препаратов?

Понимание закономерностей: Цель поиска новых лекарств

Эффективный поиск новых лекарственных препаратов неразрывно связан с выявлением соединений, способных прочно связываться с ключевыми белками-мишенями. В частности, для борьбы с такими заболеваниями, как COVID-19 и различные виды рака, критически важно идентифицировать молекулы, обладающие высоким сродством к белку 3CLPro вируса SARS-CoV-2 и белку TNKS2, играющему важную роль в развитии онкологических клеток. Высокая аффинность связывания обеспечивает эффективное ингибирование активности этих белков, что, в свою очередь, приводит к подавлению вирусной репликации или замедлению роста опухоли. Поиск таких соединений представляет собой сложную задачу, требующую анализа огромного количества химических веществ и точного прогнозирования их взаимодействия с белками-мишенями.

Традиционные методы виртуального скрининга, основанные на докинге, сталкиваются с серьёзными трудностями при исследовании огромного химического пространства и точной оценке аффинности связывания. Вычислительные ресурсы быстро истощаются при попытке протестировать миллиарды потенциальных молекул, а сложность точного моделирования взаимодействия лиганда с белком-мишенью требует значительных временных затрат. Несмотря на прогресс в алгоритмах докинга, предсказание силы связывания остаётся сложной задачей, особенно для соединений, обладающих сложной структурой или гибкостью. Это ограничивает эффективность скрининга и требует разработки новых, более быстрых и точных методов для выявления перспективных лекарственных кандидатов.

Существенная проблема в поиске эффективных лекарств усугубляется так называемыми “активностью обрывами” — небольшими изменениями в структуре молекулы, приводящими к резким колебаниям её биологической активности. Данное явление ставит под сомнение надёжность простых функций оценки сродства, используемых в виртуальном скрининге. Вместо плавного изменения, предсказуемого на основе структурного сходства, даже незначительные модификации химической структуры могут привести к переходу от неактивной молекулы к сильнодействующей, или наоборот. Это создаёт значительные трудности для алгоритмов, полагающихся на корреляцию между структурой и активностью, поскольку стандартные методы оценки могут давать ложные результаты, игнорируя критические структурные особенности, определяющие биологический эффект.

Сравнение структур, полученных с помощью Boltz-2 и докинга для белков 3CLPro и TNKS2, показывает соответствие распределений по среднеквадратичному отклонению (RMSD) для структур белков и поз лигандов, а также высокие значения LDDT, подтверждающие сохранение локального атомного окружения и взаимодействий в области связывания.

Расширяя горизонты: Искусственный интеллект в дизайне лекарств

Генеративный искусственный интеллект (ИИ) предоставляет эффективное решение для создания новых химических соединений и расширения разнообразия виртуальных библиотек скрининга. Традиционные методы разработки лекарств часто ограничены существующими химическими структурами, в то время как генеративные модели, обученные на больших наборах данных, способны генерировать молекулы с новыми каркасами и свойствами. Это позволяет значительно увеличить химическое пространство, доступное для поиска перспективных соединений-кандидатов, и повысить вероятность обнаружения молекул с желаемой активностью. Алгоритмы генеративного ИИ могут оптимизировать молекулярные свойства, такие как растворимость, биодоступность и селективность, непосредственно в процессе генерации, что сокращает время и затраты на оптимизацию на поздних стадиях разработки.

Основанные на глубоком обучении фундаментальные модели, предварительно обученные на обширных наборах данных химических соединений, позволяют генерировать новые молекулы с заданными свойствами. Процесс адаптации этих моделей, часто называемый тонкой настройкой или transfer learning, позволяет обучить их прогнозировать и оптимизировать характеристики, важные для фармацевтики, такие как растворимость, биодоступность и аффинность к целевым белкам. Использование таких моделей значительно ускоряет процесс поиска новых кандидатов в лекарственные препараты, поскольку позволяет создавать и оценивать гораздо большее количество соединений, чем традиционные методы компьютерного моделирования и скрининга. Этот подход позволяет целенаправленно создавать молекулы, отвечающие конкретным критериям, что повышает эффективность поиска и снижает затраты на экспериментальные исследования.

В качестве альтернативы традиционному молекулярному докингу, методы суррогатного докинга обеспечивают значительное ускорение процесса скрининга больших библиотек соединений. Вместо вычисления точного взаимодействия лиганда с целевым белком, суррогатные модели, как правило, основанные на машинном обучении, предсказывают аффинность связывания на основе упрощенных представлений молекул и статистических закономерностей. Это позволяет значительно сократить вычислительные затраты и время, необходимое для оценки миллионов соединений, делая возможным анализ гораздо больших химических пространств и, как следствие, повышение вероятности обнаружения перспективных кандидатов в лекарственные препараты. Эффективность суррогатного докинга напрямую зависит от качества обучающей выборки и адекватности используемой модели, однако при правильной реализации может обеспечить приемлемый уровень точности при значительном снижении вычислительной нагрузки.

Точность предсказаний: Продвинутые вычислительные методы

Вычисление энергии связывания является вычислительно сложной задачей, требующей значительных ресурсов, однако, оно критически важно для ранжирования потенциальных лекарственных кандидатов. Определение энергии связывания позволяет оценить прочность взаимодействия между молекулой-кандидатом и целевой биологической молекулой, что напрямую влияет на эффективность лекарственного препарата. Точное определение этой энергии требует учёта множества факторов, включая энтропийные и энтальпийные вклады, что делает процесс ресурсоемким. Несмотря на вычислительную сложность, ранжирование кандидатов по энергии связывания является неотъемлемой частью процесса разработки лекарств, позволяя отбирать наиболее перспективные соединения для дальнейших исследований и клинических испытаний.

Методы, такие как ESMACS и TIES, применяют техники усиленной выборки и передовые алгоритмы для точного предсказания сродства связывания для таких мишеней, как 3CLPro и TNKS2. Усиленная выборка позволяет преодолеть ограничения стандартных молекулярно-динамических симуляций, эффективно исследуя конформационное пространство и выявляя важные состояния связывания. Алгоритмы, используемые в ESMACS и TIES, включают в себя расчёт свободной энергии связывания на основе статистической механики, что позволяет количественно оценить стабильность комплекса лиганд-белок и, следовательно, предсказать аффинность связывания. Эти подходы продемонстрировали высокую точность в предсказании аффинности для широкого спектра лигандов и белков, что делает их ценными инструментами в процессе разработки лекарств.

Модель Boltz2, основанная на архитектуре с миллиардом параметров, представляет собой новый подход к предсказанию аффинности связывания, потенциально обходя необходимость в ресурсоемких вычислительных симуляциях. Однако, анализ данных по 100 соединениям показал крайне низкую корреляцию Пирсона (r ≈ 0) между значениями аффинности, предсказанными Boltz2, и значениями, рассчитанными с использованием метода ESMACS. Это указывает на ограниченную точность Boltz2 в предсказании энергий связывания, несмотря на её способность успешно генерировать комплексы.

Анализ корреляции между предсказанными энергиями связывания, полученными с помощью Boltz-2 и симуляций ESMACS, показывает, что использование структур, полученных непосредственно из предсказаний Boltz-2, SMILES-строк с учётом позиций тяжёлых атомов из Boltz-2, или докинга, даёт сопоставимые результаты, при этом различия в насыщении или протонировании некоторых соединений (обозначены красными точками) могут влиять на точность расчётов. — Анализ корреляции между предсказанными энергиями связывания, рассчитанными методами Boltz-2 $\Delta G_{\text{Boltz}}$ и ESMACS $\Delta G_{\text{ESMACS}}$ для белков 3CLPro и TNKS2, показал высокую степень согласованности, отраженную в регрессиях по главной оси (SMA), при этом цвет точек соответствует вероятностям связывания, предсказанным Boltz-2.

Будущее разработки лекарств: Интегрированный ИИ и точное моделирование

Интеграция генеративного искусственного интеллекта с точными расчётами энергии связывания, осуществляемыми такими методами, как ESMACS, TIES и Boltz2, представляет собой потенциальную революцию в конвейере разработки лекарственных препаратов. Этот симбиоз позволяет значительно ускорить процесс выявления новых терапевтических средств для широкого спектра заболеваний — от вирусных инфекций до онкологических заболеваний. Генеративные модели, способные создавать новые молекулярные структуры с заданными свойствами, в сочетании с высокоточными вычислениями энергии взаимодействия лиганда с белком-мишенью, позволяют не только сократить время и затраты на поиск перспективных кандидатов, но и существенно повысить вероятность успешной разработки эффективных и безопасных лекарств. Подобный подход открывает новые возможности для создания индивидуализированных терапий, адаптированных к конкретным генетическим и физиологическим особенностям пациента.

Интеграция генеративного искусственного интеллекта с точными методами расчёта энергии связывания, такими как ESMACS, TIES и Boltz2, открывает перспективы для значительного ускорения поиска новых лекарственных препаратов против широкого спектра заболеваний. От вирусных инфекций до онкологических заболеваний — возможность быстрого и эффективного скрининга потенциальных терапевтических соединений позволяет сократить время и затраты на разработку лекарств. Благодаря этому подходу, исследователи смогут более оперативно выявлять перспективные молекулы, направленные на конкретные мишени в организме, что особенно важно в борьбе с быстро мутирующими вирусами или агрессивными формами рака. Ускорение процесса разработки новых лекарств не только позволит быстрее реагировать на возникающие угрозы здоровью, но и предоставит возможность создавать более эффективные и персонализированные методы лечения для пациентов.

Точное моделирование взаимодействия между белками и лигандами открывает новые возможности для создания лекарственных препаратов, обладающих повышенной эффективностью и селективностью, что позволяет минимизировать нежелательные побочные эффекты. Несмотря на достигнутый прогресс, в частности, благодаря методам ESMACS, TIES и Boltz2, результаты расчётов свободной энергии связывания показывают умеренную корреляцию (от 0.45 до 0.60) с экспериментальными данными. Этот факт указывает на необходимость дальнейшего совершенствования и валидации алгоритмов, управляемых искусственным интеллектом, для более точного предсказания аффинности связывания, что является ключевым этапом в разработке принципиально новых и более безопасных лекарственных средств.

Сравнение свободных энергий связывания, полученных с помощью Boltz-2 и симуляций ESMACS, показывает, что использование структур, полученных непосредственно из предсказаний Boltz-2, SMILES-строк с учётом позиций тяжёлых атомов из Boltz-2, или докинга, даёт сопоставимые результаты, при этом различия в насыщении или протонировании некоторых соединений (обозначены красными точками) могут влиять на точность расчётов.

Исследование, представленное в статье, демонстрирует важность критической оценки методов искусственного интеллекта в процессе разработки лекарств. Модель Boltz-2, несмотря на свою эффективность в генерации структур, требует дальнейшей калибровки для точного предсказания аффинности связывания. Как однажды заметил Лев Ландау: «В науке главное — не количество полученных результатов, а их качество и глубина понимания». Этот принцип особенно актуален при использовании вычислительных методов, где необходимо сочетать скорость и точность. Оценка Boltz-2 в сравнении с физически обоснованными методами, такими как ESMACS, подчеркивает необходимость тщательной валидации и улучшения моделей искусственного интеллекта для обеспечения надежности и эффективности в области разработки новых лекарственных препаратов.

Куда двигаться дальше?

Исследование возможностей фундаметальных моделей, таких как Boltz-2, в области разработки лекарств обнажает парадоксальную ситуацию. Модель демонстрирует впечатляющую скорость генерации структур, однако её предсказания аффинности лигандов пока не соответствуют точности, достигаемой методами, основанными на физических принципах, вроде ESMACS. Это не провал, а скорее приглашение к более глубокому пониманию. Визуальные данные, генерируемые моделью, становятся отправной точкой, но требуют критической оценки и сопоставления с результатами, полученными из первых принципов.

Ключевой задачей представляется разработка гибридных подходов, сочетающих вычислительную эффективность фундаметальных моделей с физической строгостью традиционных методов. Необходимо исследовать возможности «тонкой настройки» моделей, используя экспериментальные данные и результаты молекулярной динамики, чтобы повысить точность предсказаний. Важно помнить, что аффинность — лишь один из параметров, определяющих эффективность лекарства, и необходимо учитывать другие факторы, такие как растворимость, биодоступность и токсичность.

В конечном счете, прогресс в этой области зависит не только от улучшения алгоритмов, но и от развития методологии оценки их надежности. Каждое предсказание должно сопровождаться оценкой неопределенности, а каждый результат должен рассматриваться как гипотеза, требующая экспериментального подтверждения. Понимание системы — это исследование её закономерностей, а не слепое доверие к моделям.

Оригинал статьи: https://arxiv.org/pdf/2603.05532.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-09 11:21

🚀 Квантовые новости