За пределами автоматизации: как сделать анализ данных инструментом для мышления

Автор: Денис Аветисян

Новый подход к построению процессов анализа данных с использованием промежуточных, понятных человеку результатов позволяет пользователям лучше понимать логику работы ИИ и вносить свой вклад в принятие решений.

В статье рассматривается, как проектирование прозрачных процессов анализа данных с акцентом на промежуточные артефакты может расширить возможности пользователей и повысить эффективность использования искусственного интеллекта.

Несмотря на растущую мощь генеративных моделей искусственного интеллекта в решении сложных задач анализа данных, их «черноящичный» подход зачастую препятствует осмысленному взаимодействию пользователя с процессом. В статье ‘More Than «Means to an End»: Supporting Reasoning with Transparently Designed AI Data Science Processes’ рассматривается, как создание прозрачных рабочих процессов, основанных на специально разработанных промежуточных артефактах, может расширить возможности пользователей в принятии аналитических решений и уточнении исследовательских вопросов. Исследование показало, что видимые результаты работы ИИ, такие как читаемые языки запросов или примеры ввода-вывода, помогают пользователям вносить свой уникальный опыт и эффективно использовать ИИ как инструмент для осмысления данных. Какие принципы проектирования промежуточных артефактов позволят в полной мере раскрыть потенциал ИИ в анализе данных и поддержать критическое мышление?

Трудности анализа медицинских текстов: теория против практики

Традиционные методы анализа медицинских записей, включающие ручной просмотр и кодирование, сталкиваются с серьезными трудностями при обработке огромного объема неструктурированных данных. Врачи ежедневно фиксируют важную информацию в виде повествовательных заметок, описывающих симптомы, результаты обследований и планы лечения. Извлечение значимых сведений из этих текстов требует значительных временных затрат и подвержено человеческим ошибкам. Более того, разнообразие стилей письма, медицинского жаргона и сокращений усложняет задачу автоматизированного анализа с использованием стандартных алгоритмов. В результате, ценные знания, скрытые в клинических записях, часто остаются неиспользованными, что ограничивает возможности для улучшения качества медицинской помощи и проведения эффективных исследований.

Возможности искусственного интеллекта для ускорения медицинских исследований значительно ограничиваются сложностью естественного языка и необходимостью точной идентификации ключевых понятий. Клинические записи, будучи написаны на живом, неформальном языке, часто содержат сокращения, синонимы, неоднозначные формулировки и контекстуальные нюансы, которые представляют серьезную проблему для алгоритмов обработки языка. Для эффективного анализа требуется не просто распознавание слов, но и понимание их смысла в конкретном медицинском контексте, включая выявление взаимосвязей между симптомами, диагнозами, процедурами и лекарственными препаратами. Точная идентификация этих понятий — основа для извлечения ценной информации, необходимой для разработки новых методов лечения и улучшения качества медицинской помощи, и именно здесь возникают наибольшие трудности в применении современных технологий искусственного интеллекта.

Утечка данных: главный враг достоверных моделей

Критически важной проблемой при создании надежных моделей искусственного интеллекта для здравоохранения является предотвращение «утечки данных» (Data Leakage). Это происходит, когда информация, доступная на момент прогнозирования, косвенно включает данные из будущего, что приводит к искажению результатов и нереалистично высокой оценке эффективности модели. Утечка данных может проявляться в различных формах, например, включение в обучающую выборку данных о результатах лечения, которые были неизвестны на момент принятия решения. Для обеспечения достоверности и надежности прогнозов необходимо строго контролировать процесс подготовки данных и исключать любые возможности влияния будущей информации на прошлые предсказания.

HACHI использует комплексный подход к предотвращению утечки данных и обеспечению целостности результатов. Этот подход включает в себя строгий контроль за этапами разработки и валидации моделей, а также применение методов разделения данных на обучающую, проверочную и тестовую выборки, исключающих использование будущей информации для прогнозирования в прошлом. Валидация осуществляется с использованием кросс-валидации и независимых наборов данных, что позволяет оценить обобщающую способность модели и выявить потенциальные источники утечки данных. Процедуры валидации документируются и регулярно пересматриваются для обеспечения соответствия высоким стандартам качества и надежности.

В системе HACHI обеспечение справедливости алгоритмов является приоритетной задачей. Для предотвращения предвзятых результатов используются механизмы взвешивания производительности модели, позволяющие корректировать предсказания и учитывать различные группы пациентов. В ходе итеративной доработки с привлечением экспертов-медиков, наблюдалось значительное улучшение показателей: значение AUC (Area Under the Curve) возросло с 0.71 до 0.93 на двух больничных кампусах, что подтверждает эффективность применяемых методов по минимизации систематических ошибок и обеспечению более объективных результатов.

Tempo: извлечение временных данных нового поколения

Система Tempo представляет собой решение на основе искусственного интеллекта, предназначенное для извлечения данных о временных событиях из электронных медицинских карт. В отличие от традиционных методов поиска, основанных на ключевых словах, Tempo анализирует контекст и взаимосвязи между событиями, что позволяет получать более точные и полные данные о ходе лечения пациента. Это включает в себя идентификацию не только самих событий, но и их временных характеристик, таких как дата, время и продолжительность, а также последовательность их возникновения, что критически важно для клинического анализа и принятия решений.

Система Tempo использует специализированный язык запросов, TempoQL, для точного извлечения и агрегации временных данных из электронных медицинских карт. В отличие от стандартных методов поиска, TempoQL позволяет формулировать сложные запросы, ориентированные на конкретные временные интервалы и взаимосвязи между событиями. Данный язык расширяет функциональность EHR-Agent, предоставляя более гранулярный контроль над процессом извлечения данных и позволяя получать информацию, недоступную при использовании традиционных инструментов. Это обеспечивает возможность проведения более глубокого анализа данных и выявления закономерностей, связанных со временем.

Система Tempo дополнена интеллектуальным помощником, позволяющим пользователям формулировать запросы на естественном языке. Этот помощник транслирует запросы, заданные на естественном языке, в TempoQL, специализированный язык запросов. Согласно результатам тестирования, использование AI-помощника обеспечивает формирование корректных запросов в 2.5 раза чаще, чем при использовании SQL для решения той же задачи, что повышает эффективность извлечения временных данных из электронных медицинских карт.

Прозрачность как основа доверия: промежуточные артефакты

В системах HACHI и Tempo ключевую роль играют так называемые «промежуточные артефакты» — наглядные представления о логике принятия решений искусственным интеллектом. Эти артефакты позволяют исследователям просматривать и анализировать ход вычислений, а также при необходимости корректировать направление анализа. Вместо «черного ящика», где причины результатов остаются неясными, системы предоставляют возможность отследить цепочку рассуждений, что значительно повышает доверие к полученным данным и обеспечивает контроль над процессом анализа. Такой подход не только способствует валидации выводов, но и позволяет адаптировать систему к специфическим требованиям и контексту исследования.

Особое внимание к прозрачности процесса анализа данных способствует укреплению доверия к полученным результатам. В системах, подобных HACHI и Tempo, промежуточные артефакты — конкретные представления логики, использованной искусственным интеллектом — позволяют исследователям не только проверить ход рассуждений, но и при необходимости скорректировать его. Каждая такая проверка, осуществляемая командой специалистов, занимает приблизительно один-два часа, что подтверждает возможность эффективного контроля над сложными аналитическими задачами и обеспечивает надежность и воспроизводимость научных выводов.

В основе стабильности и надёжности научных исследований, проводимых с использованием систем искусственного интеллекта, лежит разработанная структура PCS (Provenance, Consistency, and Scalability). Эта методология обеспечивает систематизированный подход к кодированию лучших практик в области анализа данных, что позволяет гарантировать воспроизводимость результатов и минимизировать ошибки. PCS не просто описывает процесс, но и предоставляет чёткие правила для документирования каждого этапа — от сбора и обработки данных до построения моделей и интерпретации полученных результатов. Благодаря этому, учёные могут быть уверены в корректности выводов, а процесс разработки становится более предсказуемым и эффективным, способствуя ускорению научных открытий и повышению доверия к результатам исследований.

Будущее за генеративным ИИ: большие языковые модели

Генеративный искусственный интеллект, основанный на больших языковых моделях (БЯМ), всё активнее внедряется в функциональность систем HACHI и Tempo. Эти модели выступают в роли ключевого элемента, обеспечивающего возможность обработки и анализа сложных данных, выходя за рамки традиционных алгоритмов. Внедрение БЯМ позволяет системам не просто находить информацию, но и интерпретировать её, выявлять закономерности и генерировать новые гипотезы, что значительно расширяет возможности для медицинских исследований и открытий. Интеграция подобных технологий является фундаментальным шагом в развитии интеллектуальных систем, способных оказывать существенное влияние на будущее здравоохранения.

В основе способности систем HACHI и Tempo к решению сложных задач лежит применение больших языковых моделей (LLM) в качестве движущей силы логических заключений. Эти модели не просто обрабатывают информацию, но и способны к извлечению глубокого смысла из неструктурированных данных, таких как медицинские записи и научные публикации. Благодаря LLM, системы способны выявлять взаимосвязи, ранее незаметные для стандартных алгоритмов, что значительно повышает точность и эффективность анализа. Вместо простого поиска по ключевым словам, LLM позволяют понимать контекст и намерения, что открывает возможности для более сложного и детального извлечения информации и, как следствие, для ускорения медицинских открытий.

Постоянное совершенствование больших языковых моделей (LLM) открывает новые горизонты для возможностей систем, подобных HACHI и Tempo. Улучшения в архитектуре LLM, включая увеличение объема данных для обучения и разработку более эффективных алгоритмов, позволяют им не только лучше понимать сложные медицинские тексты, но и выводить более точные и значимые результаты анализа. В перспективе, это может привести к ускорению процесса обнаружения новых лекарственных препаратов, персонализации лечения и углублению понимания механизмов развития заболеваний, что, в конечном итоге, существенно повлияет на качество и продолжительность жизни пациентов. Ожидается, что дальнейшие инновации в области LLM позволят автоматизировать рутинные задачи, высвобождая ресурсы для более творческой и сложной исследовательской работы.

Наблюдая за стремлением к автоматизации в анализе данных, представляется, что создатели систем часто упускают из виду ключевой аспект — необходимость промежуточных, читаемых человеком артефактов. Стараются запихнуть всё в чёрный ящик, полагая, что алгоритм сам найдёт оптимальное решение. Но, как показывает опыт, «всегда найдётся способ сломать элегантную теорию». Дональд Кнут однажды заметил: «Прежде чем оптимизировать код, убедитесь, что он работает». И в данном контексте это особенно актуально: пока процесс анализа непрозрачен и не поддаётся проверке человеком, все разговоры о «самовосстанавливающихся» системах и «интеллектуальных» алгоритмах — лишь иллюзия. Попытки создать инструменты для мышления, игнорируя потребность в промежуточных результатах, обречены на провал, ведь без возможности осмыслить и проверить каждый шаг, даже самый мощный алгоритм превращается в источник непредсказуемых ошибок.

Что дальше?

Предложенный подход, акцентирующий внимание на промежуточных артефактах в процессах AI Data Science, неизбежно наталкивается на старую проблему: каждая «прозрачность» рано или поздно превращается в ещё один слой абстракции, требующий интерпретации. Удобство читаемости промежуточных результатов — это иллюзия, пока эти результаты не будут сопоставлены с реальным контекстом, а контекст, как известно, непостоянен. Очевидно, что инструменты для работы с этими артефактами, предлагаемые сейчас, — это лишь прототипы, требующие постоянной адаптации к меняющимся алгоритмам и потребностям пользователей.

Более того, наивная вера в «человека в цикле» может оказаться преждевременной. Производственные процессы всегда найдут способ упростить и автоматизировать даже самые изящные решения, сведя ценность человеческого вклада к формальному одобрению результатов, а не к активному участию в анализе. Архитектура, основанная на промежуточных артефактах, — это не схема, а компромисс, который рано или поздно придётся пересматривать, учитывая неизбежный технический долг.

Поэтому, вместо того, чтобы стремиться к идеальной прозрачности, следует сосредоточиться на создании инструментов, позволяющих быстро адаптироваться к изменениям и эффективно работать с неполной информацией. Всё, что оптимизировано, рано или поздно оптимизируют обратно. И, возможно, в конечном итоге, мы не рефакторим код — мы реанимируем надежду.

Оригинал статьи: https://arxiv.org/pdf/2603.24877.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-27 07:00

🚀 Квантовые новости