Искусственный интеллект на службе лекарства: Новый подход к поиску модуляторов GPCR

Автор: Денис Аветисян

Ученые разработали систему, использующую глубокое обучение для более эффективного и точного выявления перспективных лекарственных соединений, воздействующих на важный класс рецепторов.

Разработанный фильтр GPCR-Filter интегрируется в процесс открытия модуляторов GPCR, используя исключительно последовательности GPCR для уточнения результатов докинга после начального структурно-ориентированного виртуального скрининга, при этом последовательности GPCR преобразуются в представления на уровне остатков с помощью предварительно обученной языковой модели белков, а SMILES лигандов кодируются в характеристики на уровне атомов посредством молекулярной графовой нейронной сети, объединяемых модулем перекрестного внимания для вычисления вероятности взаимодействия.

Представленный фреймворк GPCR-Filter объединяет возможности языковых моделей белков и графовых нейронных сетей для улучшения виртуального скрининга модуляторов GPCR.

Несмотря на центральную роль рецепторов, сопряженных с G-белками (GPCR), в регуляции физиологических процессов, открытие их модуляторов остается сложной задачей из-за аллостерических эффектов и ограничений традиционных методов. В данной работе представлена платформа ‘GPCR-Filter: a deep learning framework for efficient and precise GPCR modulator discovery’, использующая глубокое обучение для эффективного и точного поиска модуляторов GPCR. Разработанный подход объединяет модель языка белков ESM-3 и графовые нейронные сети, демонстрируя превосходство над существующими моделями и успешную идентификацию агонистов рецептора 5-HT $\textsubscript{1A}$ с различными химическими структурами. Способна ли эта платформа значительно ускорить разработку новых лекарственных препаратов, нацеленных на сложные сигнальные системы?

Глубокое Понимание GPCR: Вызовы и Возможности

G-белковые сопряженные рецепторы (GPCR) представляют собой важнейшие мишени для разработки лекарственных препаратов, поскольку они участвуют в регуляции огромного числа физиологических процессов. Однако, идентификация эффективных лигандов, способных специфически взаимодействовать с этими рецепторами и вызывать желаемый терапевтический эффект, остается серьезной проблемой. Сложность структуры GPCR, их гибкость и разнообразие конформаций, а также тонкие различия в связывающих участках затрудняют процесс поиска подходящих молекул. Несмотря на значительный прогресс в области вычислительной химии и высокопроизводительного скрининга, разработка новых лекарств, воздействующих на GPCR, требует значительных временных и финансовых затрат, а также часто сопровождается неудачами на поздних стадиях клинических испытаний.

Традиционные методы виртуального скрининга, несмотря на свою распространенность, часто оказываются недостаточно эффективными при поиске соединений, взаимодействующих с G-белково-связанными рецепторами (GPCR). Сложность заключается в динамичной конформации этих рецепторов и тонких нюансах взаимодействия лиганда с рецептором, которые трудно точно смоделировать. В результате, значительная часть потенциальных соединений, отобранных виртуальным скринингом, не проявляет активности в лабораторных условиях, что приводит к низкому проценту положительных результатов и нерациональному использованию ресурсов, как временных, так и финансовых. Учет гибкости рецептора и более точное моделирование гидрофобных взаимодействий и водородных связей являются ключевыми задачами для повышения эффективности подобных исследований.

Экспериментальная валидация подтвердила, что фильтр GPCR успешно идентифицировал четыре агониста (<span class="katex-eq" data-katex-display="false">D24</span>, <span class="katex-eq" data-katex-display="false">D29</span>, <span class="katex-eq" data-katex-display="false">D34</span>, <span class="katex-eq" data-katex-display="false">D47</span>), активирующих рецептор <span class="katex-eq" data-katex-display="false">5-HT1A</span> дозозависимым образом, демонстрируя сравнимую или более высокую максимальную эффективность (<span class="katex-eq" data-katex-display="false">Emax</span>), но пониженную потенцию (<span class="katex-eq" data-katex-display="false">EC50</span>) по сравнению с каноническим агонистом 5-HT. — Экспериментальная валидация подтвердила, что фильтр GPCR успешно идентифицировал четыре агониста ( $D24$ , $D29$ , $D34$ , $D47$ ), активирующих рецептор $5-HT1A$ дозозависимым образом, демонстрируя сравнимую или более высокую максимальную эффективность ( $Emax$ ), но пониженную потенцию ( $EC50$ ) по сравнению с каноническим агонистом 5-HT.

GPCR-Filter: Новый Инструмент для Рационального Дизайна Лекарств

GPCR-Filter представляет собой новую систему глубокого обучения, разработанную для ускорения процесса открытия лекарственных препаратов, нацеленных на G-белковые рецепторы (GPCR). Данный фреймворк предназначен для повышения эффективности скрининга и оптимизации соединений, взаимодействующих с GPCR, за счет автоматизации этапов анализа и предсказания активности лигандов. Система предназначена для интеграции в существующие пайплайны разработки лекарств и обеспечивает возможность прогнозирования аффинности связывания и селективности лигандов к различным подтипам GPCR. Особенностью GPCR-Filter является его способность обрабатывать большие объемы данных и выявлять закономерности, недоступные при традиционных методах исследования.

В основе GPCR-Filter лежит интеграция двух ключевых подходов для представления биомолекул. Информация о последовательности GPCR кодируется с использованием ESM-3 вложений, обеспечивающих эффективное представление аминокислотных последовательностей и их взаимосвязей. Для представления структуры и химических свойств лигандов используется подход на основе графовых нейронных сетей (GNN). GNN позволяют моделировать молекулы как графы, где атомы являются узлами, а химические связи — ребрами, что позволяет учитывать пространственное строение и химические взаимодействия лигандов при анализе их связывания с рецептором.

В основе GPCR-Filter лежит архитектура Transformer, использующая механизмы перекрестного внимания (Cross-Attention) для интеграции признаков лиганда и рецептора. Перекрестное внимание позволяет модели динамически оценивать релевантность различных частей лиганда по отношению к конкретным участкам рецептора, и наоборот. Это достигается путем вычисления весов внимания, определяющих вклад каждого признака лиганда в представление рецептора, и наоборот. Такой подход обеспечивает более эффективное взаимодействие между признаками лиганда и рецептора, что позволяет модели точнее предсказывать аффинность связывания и активность соединений. В рамках архитектуры Transformer, механизмы перекрестного внимания применяются для формирования контекстно-зависимых представлений, учитывающих взаимодействие между лигандом и рецептором на различных уровнях детализации.

Сравнительный анализ стратегий разделения данных (случайное, внутрицелевое и межцелевое) показал, что межцелевое разделение обеспечивает наилучшую дискриминационную способность моделей GPCR-Filter и базовых моделей, оцениваемую по ROC-кривым, в то время как внутрицелевое и случайное разделение приводят к снижению производительности.

Валидация и Обобщающая Способность GPCR-Filter

Тщательное тестирование показало, что GPCR-Filter точно предсказывает сродство лигандов к рецепторам, что подтверждено анализом с использованием GloSensor cAMP Assay. Данный анализ измеряет активацию G-белков, опосредованную связыванием лиганда с GPCR, и позволяет количественно оценить сродство. Высокая корреляция между предсказанным и экспериментально определенным сродством подтверждает надежность и точность GPCR-Filter в прогнозировании взаимодействия лиганд-рецептор.

В ходе тестирования было продемонстрировано, что разработанный фреймворк обладает высокой способностью к обобщению внутри целевой группы (Intra-Target Generalization). Это означает, что он успешно предсказывает взаимодействие новых лигандов с уже известными рецепторами GPCR. Результаты показали достижение площади под ROC-кривой (AUC) в 97.16% в рамках разделения данных Intra-Target, что свидетельствует о высокой точности предсказаний для лигандов, взаимодействующих с ранее изученными GPCR.

В ходе тестирования GPCR-Filter продемонстрировал значительные возможности обобщения на новые цели (Inter-Target Generalization), успешно предсказывая взаимодействия с ранее не изученными GPCR. В ходе разделения данных (Inter-Target split) были достигнуты следующие показатели: площадь под ROC-кривой (AUC) составила 73.44%, а средняя точность (AP) — 64.04%. Эти результаты свидетельствуют о способности модели экстраполировать знания, полученные на известных GPCR, на новые, не входящие в обучающую выборку.

Анализ карманов связывания двух комплексов GPCR (PDB 9bsb и 9jcl) показал, что модель последовательно и точно определяет ключевые остатки, участвующие в связывании лиганда, с вероятностью более 0.5 по всем оценкам (Random, Intra-target, Inter-target), причем приоритетные остатки (<span class="katex-eq" data-katex-display="false">index</span>-аминокислота) локализуются в кристаллиграфическом сайте связывания. — Анализ карманов связывания двух комплексов GPCR (PDB 9bsb и 9jcl) показал, что модель последовательно и точно определяет ключевые остатки, участвующие в связывании лиганда, с вероятностью более 0.5 по всем оценкам (Random, Intra-target, Inter-target), причем приоритетные остатки ( $index$ -аминокислота) локализуются в кристаллиграфическом сайте связывания.

Ускорение Процесса Открытия Лекарственных Препаратов: Влияние GPCR-Filter

Система GPCR-Filter значительно оптимизирует процесс разработки лекарственных препаратов, позволяя существенно сократить объём дорогостоящих и трудоёмких экспериментальных исследований. Вместо того, чтобы анализировать огромное количество потенциальных кандидатов, система эффективно выявляет наиболее перспективные соединения, что позволяет сконцентрировать ресурсы на их дальнейшем изучении. Такой подход не только экономит время и средства, но и повышает вероятность успешного выявления активных молекул, ускоряя тем самым появление новых лекарственных средств на рынке. Эффективная приоритизация кандидатов, осуществляемая GPCR-Filter, представляет собой значительный шаг вперёд в оптимизации процесса поиска и разработки инновационных фармацевтических препаратов.

Эффективность предложенной системы значительно повышается благодаря тщательному отбору и очистке данных, используемых для обучения. Гарантированное качество исходных данных является критически важным фактором, поскольку любые неточности или ошибки в обучающей выборке могут привести к снижению точности прогнозов и, как следствие, к ошибочному отсеву перспективных соединений. Процесс курации данных включает в себя удаление дубликатов, исправление ошибок, стандартизацию форматов и, что особенно важно, исключение ложноположительных результатов, что позволяет модели обучаться на достоверной информации и демонстрировать более высокую надежность при анализе новых молекул. Такой подход не только оптимизирует работу алгоритма, но и существенно сокращает время и ресурсы, затрачиваемые на дальнейшие экспериментальные исследования.

Разработка GPCR-Filter позволила значительно оптимизировать как последовательно-основанный, так и структурно-основанный скрининг потенциальных лекарственных соединений. Вместо всестороннего анализа огромного количества молекул, система концентрирует ресурсы на наиболее перспективных кандидатах, что существенно сокращает временные и финансовые затраты. Ключевым аспектом является использование характеристик связывающего кармана рецептора, что обеспечивает обогащение предсказанных активных соединений именно в этой области. Наблюдаемое увеличение концентрации «попаданий» в связывающем кармане подтверждает высокую точность предсказаний и эффективность подхода, открывающего новые возможности для ускорения процесса разработки лекарственных препаратов.

Представленная работа демонстрирует стремление к математической чистоте в области разработки лекарственных средств. Разработанный фреймворк GPCR-Filter, использующий глубокое обучение и графовые нейронные сети, представляет собой элегантное решение для повышения точности виртуального скрининга модуляторов GPCR. Как однажды заметил Марвин Минский: «Наиболее полезная форма знания — это знания, которые можно использовать для создания чего-то нового». Этот подход особенно актуален здесь, поскольку GPCR-Filter не просто улучшает существующие методы, а предлагает принципиально новый способ идентификации потенциальных лекарственных соединений, основанный на строгих алгоритмических принципах и доказанной корректности. Акцент на точность и эффективность, присущий данной разработке, подтверждает, что истинная ценность алгоритма заключается не в его способности «работать на тестах», а в его математической доказуемости и способности к генерации новых, надежных результатов.

Куда Далее?

Представленная работа, несомненно, представляет собой шаг вперед в области виртуального скрининга модуляторов GPCR. Однако, истинная элегантность алгоритма проявляется не в достижении наивысшей точности на текущем наборе данных, а в его способности к обобщению. Очевидным ограничением остается зависимость от качества и объема обучающих данных. Любой, даже самый изящный, алгоритм бесполезен, если его «знания» ограничены узким спектром известных лигандов. Будущие исследования должны быть направлены на создание моделей, менее чувствительных к предвзятости данных и способных экстраполировать за пределы известных химических пространств.

Следующим логичным шагом представляется интеграция GPCR-Filter с другими вычислительными методами, такими как молекулярная динамика и квантово-химические расчеты. Сочетание силы глубокого обучения с фундаментальными принципами физики и химии может привести к созданию действительно предсказуемых моделей. Впрочем, следует помнить, что даже самые сложные вычисления — лишь приближения к реальности. Идеальное соответствие модели и эксперимента — недостижимая цель, но стремление к ней — двигатель прогресса.

В конечном итоге, ценность GPCR-Filter, как и любой другой вычислительной модели, будет определяться не ее сложностью, а ее способностью ускорить процесс открытия новых лекарств. Важно помнить, что цель — не создание красивого алгоритма, а облегчение страданий пациентов. И в этом смысле, предстоит еще много работы.

Оригинал статьи: https://arxiv.org/pdf/2601.19149.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-01-28 08:21

🚀 Квантовые новости