Автор: Денис Аветисян
Ученые разработали систему, использующую возможности больших языковых моделей для автоматизации сложного анализа гистологических препаратов и открытия новых знаний.

Представлен агентский фреймворк Nova и эталонный набор данных SlideQuest для оценки систем автоматизированного анализа цельных гистологических срезов.
Анализ гистопатологических изображений требует значительных временных затрат и высокой квалификации, ограничивая доступность передовых исследований. В статье ‘NOVA: An Agentic Framework for Automated Histopathology Analysis and Discovery’ представлена система NOVA — агентский фреймворк, использующий большие языковые модели и специализированные инструменты для автоматизации комплексного анализа гистологических данных. NOVA способна самостоятельно генерировать и выполнять Python-код, интегрируя 49 существующих инструментов и создавая новые по мере необходимости, а также была протестирована на новом бенчмарке SlideQuest, требующем многоступенчатого логического мышления. Открывает ли это путь к масштабируемым открытиям в области патологии и персонализированной медицины, и какие еще задачи может решить подобный подход?
Традиционная патология и вызовы цифровой эпохи
Традиционный гистопатологический анализ, являясь «золотым стандартом» диагностики, сопряжен со значительными временными затратами и субъективностью оценки. Процесс требует от патоморфолога детального изучения образцов тканей под микроскопом, что занимает часы, а в некоторых случаях и дни. Более того, интерпретация изображений может варьироваться между разными специалистами, приводя к расхождениям в диагнозах — так называемой межэкспертной вариабельности. Эта субъективность не только влияет на качество медицинской помощи, но и затрудняет проведение масштабных исследований, поскольку результаты могут быть искажены различиями в оценке. В результате, ручной анализ становится узким местом в современной патологии, ограничивая скорость и точность диагностики, а также тормозя прогресс в области биомедицинских исследований.
Растущий объем цифровых изображений цельных срезов тканей (Whole-Slide Images, WSIs) создает серьезную потребность в автоматизированных решениях, способных к сложному, многоступенчатому анализу. Современные методы диагностики, основанные на ручном изучении гистологических препаратов, становятся все более затруднительными из-за огромного количества данных, генерируемых в результате высокопроизводительного сканирования. Автоматизированные системы должны не просто обнаруживать отдельные признаки, но и интегрировать их в контексте всей ткани, выполнять сложные логические выводы и имитировать процесс принятия решений, характерный для опытного патоморфолога. Такой подход позволит значительно повысить скорость и точность диагностики, а также снизить влияние субъективного фактора, что особенно важно при анализе сложных случаев и проведении научных исследований.
Существующие системы анализа изображений в патологии зачастую демонстрируют ограниченную приспособляемость к различным задачам и наборам данных. Традиционные алгоритмы, разработанные для конкретного типа ткани или признака, могут испытывать значительные трудности при анализе изображений, полученных из других источников или требующих выявления иных патологических изменений. Это связано с тем, что они, как правило, жестко запрограммированы на поиск определенных характеристик и не способны к самостоятельному обучению или адаптации к новым условиям. В результате, для каждой новой задачи требуется значительная переработка и оптимизация алгоритмов, что снижает эффективность и увеличивает временные затраты. Необходимость в более гибких и интеллектуальных системах, способных к самообучению и адаптации к разнообразным данным, становится все более очевидной для повышения точности и скорости диагностики.

Nova: Агентный каркас для интеллектуальной патологии
В основе системы Nova лежит большая языковая модель (LLM), выполняющая роль центрального управляющего элемента. Данная модель способна интерпретировать запросы, сформулированные на естественном языке, и преобразовывать их в исполняемый Python-код. Этот процесс позволяет пользователям взаимодействовать с системой, используя привычный язык, без необходимости знания синтаксиса Python или специализированных скриптов. LLM анализирует запрос, определяет необходимые шаги для выполнения поставленной задачи и генерирует соответствующий код, который затем исполняется для обработки данных и получения результатов.
Система Nova построена на базе SmolAgents — гибкого фреймворка, предназначенного для создания и управления автономными агентами. SmolAgents обеспечивает модульную структуру, позволяющую легко определять, развертывать и координировать множество взаимодействующих агентов. Фреймворк предоставляет инструменты для определения целей агентов, управления их памятью и обеспечения коммуникации между ними. Ключевой особенностью является возможность динамического создания и уничтожения агентов в процессе выполнения задачи, что повышает адаптивность системы к изменяющимся условиям и новым требованиям. Архитектура SmolAgents позволяет интегрировать различные типы агентов, специализирующихся на определенных задачах, обеспечивая масштабируемость и расширяемость системы Nova.
Система Nova использует интерпретатор Python для выполнения сгенерированного кода, что позволяет осуществлять обработку данных гистологических изображений, их анализ и визуализацию. Интерпретатор обеспечивает динамическое выполнение кода, созданного языковой моделью, что позволяет агенту выполнять сложные операции, такие как сегментация изображений, количественная оценка морфометрических параметров и построение графиков. Результаты выполнения кода могут быть представлены в виде таблиц, диаграмм или модифицированных изображений, что обеспечивает удобную интерпретацию и дальнейший анализ полученных данных. В процессе выполнения кода интерпретатор Python взаимодействует с интегрированными специализированными инструментами, предназначенными для решения конкретных задач в области гистопатологии.
В рамках агентивной системы Nova, специализированные инструменты, представленные в виде функций на языке Python, интегрированы для выполнения конкретных задач в области гистопатологии. Эти инструменты позволяют агентам автоматизировать такие процессы, как сегментация изображений, количественная оценка морфометрии тканей, выявление специфических клеточных структур и анализ иммуногистохимических маркеров. Функции разрабатываются и внедряются как модули, расширяющие возможности системы и позволяющие адаптировать Nova к различным исследовательским потребностям и клиническим задачам. Интеграция этих инструментов обеспечивает гибкость и масштабируемость агентивного подхода к анализу гистологических препаратов.

Оценка Nova на платформе SlideQuest: подтверждение возможностей
SlideQuest представляет собой оценочный набор данных, состоящий из 90 вопросов, предназначенный для проверки вычислительных агентов в области патологии. Особенностью SlideQuest является необходимость выполнения многоступенчатого рассуждения и анализа на уровне всего набора данных, а не только отдельных изображений. Это подразумевает, что агенты должны не просто распознавать объекты на изображениях, но и интегрировать информацию из различных источников данных и применять логические выводы для ответа на вопросы, требующие комплексной интерпретации патологических данных.
Результаты тестирования Nova на платформе SlideQuest демонстрируют ее способность решать широкий спектр задач, включающий DataQA (оценка качества данных), PatchQA (оценка качества отдельных фрагментов изображений) и SlideQA (оценка качества целых изображений гистологических срезов). Данный набор задач позволяет оценить возможности агента в комплексном анализе патологических изображений, требующем многоступенчатого рассуждения и анализа данных на уровне всего набора. Успешное выполнение задач DataQA, PatchQA и SlideQA подтверждает универсальность Nova и ее способность адаптироваться к различным аспектам анализа гистологических изображений.
В рамках задач CellularQA в бенчмарке SlideQuest используются датасеты MoNuSeg и PanopTILs для оценки возможностей анализа на уровне отдельных клеток. MoNuSeg содержит изображения клеток, размеченных для сегментации, что позволяет оценивать точность определения границ клеток и их характеристик. PanopTILs, в свою очередь, предоставляет изображения гистологических срезов с аннотациями, обозначающими различные типы клеток, в частности, опухолево-инфильтрирующие лимфоциты (TILs). Использование этих датасетов позволяет оценить способность агента выполнять задачи, связанные с идентификацией, классификацией и количественным анализом клеток в сложных гистологических изображениях.
В рамках оценки вычислительных агентов в патологии, агентская платформа Nova, использующая бенчмарк SlideQuest, показала средний результат 0.477 по сложным гистопатологическим задачам. Данный показатель демонстрирует эффективность использования больших языковых моделей (LLM), дополненных инструментами, для анализа данных в области патологии. Тестирование проводилось на 90-вопросном бенчмарке SlideQuest, включающем задачи DataQA, PatchQA и SlideQA, что позволило оценить способность Nova к многоступенчатому рассуждению и анализу данных на уровне датасетов.
При валидации на бенчмарке SlideQuest, агентская платформа Nova продемонстрировала превосходство над базовыми моделями. Nova достигла среднего балла 0.477 по комплексу задач, в то время как модель LLM с интерпретатором Python и повторными попытками набрала 0.269, а LLM без дополнительных инструментов — 0 баллов. Данный результат подтверждает эффективность использования инструментально-дополненных больших языковых моделей (LLM) для решения сложных задач в области гистопатологии.
В ходе тестирования Nova на платформе SlideQuest, агент показал наивысший результат в категории DataQA, достигнув значения 0.777. Этот показатель превосходит результаты, полученные в других категориях, включая SlideQA и PatchQA. При этом, самая низкая оценка была зафиксирована в категории CellularQA — 0.323. Данные результаты демонстрируют, что Nova наиболее эффективно справляется с задачами, требующими анализа и интерпретации данных, представленных в структурированном формате, в то время как задачи, связанные с анализом отдельных клеток, представляют наибольшую сложность.

Путь к масштабируемой и интеллектуальной патологии: взгляд в будущее
Система Nova знаменует собой принципиальный сдвиг в подходе к анализу патологических изображений, отходя от традиционных, жестко запрограммированных конвейеров к интеллектуальным, автономным системам. Вместо последовательного применения фиксированных алгоритмов, Nova использует агентов, способных самостоятельно формулировать задачи, планировать действия и выполнять их, используя мощь больших языковых моделей (LLM) и автоматического выполнения кода. Такой подход позволяет системе адаптироваться к различным исследовательским вопросам и данным, динамически перестраивая рабочий процесс в зависимости от поставленной задачи. В отличие от традиционных методов, где каждое изменение требует ручной переработки конвейера, Nova способна к самообучению и оптимизации, открывая новые возможности для автоматизированного анализа и обнаружения закономерностей в патологических изображениях.
Предлагаемый подход радикально изменяет традиционные рабочие процессы в патологии, обеспечивая беспрецедентную гибкость и адаптивность. Вместо жестко заданных последовательностей анализа, система способна динамически подстраиваться под конкретные исследовательские задачи, будь то выявление редких клеточных структур, количественная оценка экспрессии биомаркеров или автоматизированный поиск корреляций между гистологическими данными и клиническими параметрами. Такая адаптивность позволяет исследователям быстро переключаться между различными вопросами, исследовать новые гипотезы и извлекать максимум информации из цифровых изображений тканей, без необходимости перепрограммирования или ручной настройки аналитических конвейеров. В результате, становится возможным проводить более глубокий и всесторонний анализ, открывая новые перспективы для понимания механизмов заболеваний и разработки персонализированных методов лечения.
Внедрение больших языковых моделей (LLM) и автоматического выполнения кода открывает принципиально новые возможности для исследований в патологии и смежных областях. Такой подход позволяет не просто анализировать изображения, но и активно формулировать гипотезы, проводить сложные вычисления и автоматически адаптировать аналитические стратегии к специфике каждого случая. Возможность автоматической генерации и выполнения кода позволяет создавать персонализированные алгоритмы анализа, оптимизированные для конкретных типов тканей или заболеваний, что значительно повышает точность и скорость диагностики. Данная технология позволяет автоматизировать рутинные задачи, высвобождая время патологов для более сложных случаев и творческих исследований, а также открывает путь к обнаружению новых биомаркеров и пониманию механизмов развития заболеваний на принципиально новом уровне.
Разработанная платформа отличается высокой адаптируемостью к различным наборам данных и задачам, что делает её масштабируемым решением для удовлетворения растущих потребностей цифровой патологии. В отличие от традиционных систем, требующих значительной перенастройки при изменении входных данных или целей исследования, данная архитектура позволяет быстро интегрировать новые типы изображений и адаптировать алгоритмы анализа без существенных изменений в коде. Это достигается благодаря модульной конструкции и использованию автоматизированного выполнения кода, что позволяет исследователям легко экспериментировать с различными подходами и оперативно получать результаты. Такая гибкость особенно важна в контексте быстрого развития технологий цифровой визуализации и необходимости анализа всё возрастающих объёмов данных, открывая новые возможности для диагностики, прогнозирования и разработки персонализированных методов лечения.

Исследование, представленное в данной работе, демонстрирует стремление к созданию систем, способных адаптироваться к сложности гистопатологических данных. Nova, как агентская структура, представляет собой попытку преодолеть ограничения традиционных подходов к анализу изображений целых срезов. Подобно тому, как время неумолимо влияет на любую систему, так и сложность данных требует постоянной адаптации и совершенствования инструментов анализа. Анри Пуанкаре однажды заметил: «Математика — это искусство находить закономерности в хаосе». В контексте данной работы, Nova стремится выявить скрытые закономерности в сложных гистопатологических изображениях, тем самым приближая медицину к более точному и эффективному диагностированию. Создание эталонного набора данных SlideQuest подчеркивает необходимость объективной оценки производительности таких систем, осознавая, что кажущаяся стабильность может быть лишь временной задержкой перед неизбежными изменениями в понимании сложных биологических процессов.
Что Дальше?
Представленная работа, как и любая попытка формализовать сложность биологических систем, лишь временно задерживает неизбежное течение энтропии. Nova, с её агентным подходом и SlideQuest, представляет собой локальное снижение неопределённости, но не отменяет фундаментальной зыбкости интерпретаций, полученных из гистопатологических изображений. Стабильность здесь — это иллюзия, закэшированная временем, а каждый запрос — это плата за задержку в бесконечном потоке данных.
Будущие исследования, вероятно, сосредоточатся на преодолении границ текущих больших языковых моделей. Необходима разработка систем, способных не просто распознавать паттерны, но и демонстрировать истинное понимание контекста, включая тонкие нюансы, упускаемые из виду даже опытными патологами. Вместо стремления к абсолютной точности, акцент сместится на повышение робастности и адаптивности систем к изменениям в данных и протоколах.
В конечном счёте, ценность Nova и подобных ей фреймворков будет определяться не столько их способностью автоматизировать рутинные задачи, сколько их потенциалом для выявления неожиданных связей и генерации новых гипотез. Системы стареют — вопрос лишь в том, сделают ли они это достойно, оставив после себя не просто горы обработанных данных, а подлинные открытия.
Оригинал статьи: https://arxiv.org/pdf/2511.11324.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Восполняя пробелы в знаниях: Как языковые модели учатся делать выводы
- Квантовый Монте-Карло: Моделирование рождения электрон-позитронных пар
- Квантовый скачок из Андхра-Прадеш: что это значит?
- Виртуальная примерка без границ: EVTAR учится у образов
- Геометрия на пределе: как алгоритмы оптимизации превосходят языковые модели
- Разгадывая тайны квантового мира: переработка кубитов и шум как тайная приправа?
- Оптимизация партийных запросов: Метод имитации отжига против градиентных подходов
- Эмоциональный отпечаток: Как мы научили ИИ читать душу (и почему рейтинги вам врут)
- Скрытая сложность: Необратимые преобразования в квантовых схемах
2025-11-18 02:47