Как ученые используют искусственный интеллект: новый взгляд на взаимодействие

Автор: Денис Аветисян

Исследование представляет масштабный набор данных, отражающий реальный опыт взаимодействия исследователей с ИИ-помощниками в научной работе.

Интерфейсы Asta, использованные в исследовании (Singh и др., 2025; Allen Institute for Artificial Intelligence, 2025), демонстрируют различные способы взаимодействия с системой, что позволяет оценить эффективность и удобство использования различных подходов к организации пользовательского опыта.

Представлен Asta Interaction Dataset — логи пользовательских взаимодействий с ИИ-ассистентом, анализирующие запросы, вовлеченность и использование в научных рабочих процессах.

Несмотря на стремительное внедрение инструментов на основе искусственного интеллекта в научные исследования, остается мало информации о реальных моделях их использования. В работе ‘Understanding Usage and Engagement in AI-Powered Scientific Research Tools: The Asta Interaction Dataset’ представлен и проанализирован масштабный набор данных Asta Interaction Dataset, включающий более 200 000 запросов и логов взаимодействия пользователей с двумя инструментами — поиском научной литературы и системой ответов на научные вопросы. Анализ показывает, что пользователи формулируют более сложные запросы, чем при традиционном поиске, и рассматривают систему как партнера, делегируя задачи по составлению текстов и выявлению пробелов в исследованиях. Какие новые возможности для оптимизации и персонализации интеллектуальных помощников в науке открывает понимание паттернов взаимодействия с такими системами?

Преодолевая Ограничения Традиционного Поиска

Традиционные методы академического поиска, основанные на сопоставлении ключевых слов, зачастую не способны уловить тонкие смысловые оттенки и сложные взаимосвязи, существующие в научных исследованиях. Вместо глубокого понимания контекста и аргументации, системы выдают результаты, соответствующие формальному совпадению терминов, что приводит к потере важной информации и искажению научной картины. Это особенно заметно при поиске исследований, использующих синонимы, метафоры или рассматривающих проблему с разных точек зрения. В результате, исследователю приходится просматривать значительное количество нерелевантных материалов, чтобы найти действительно ценные источники, что существенно замедляет процесс научной работы и может привести к упущению важных открытий.

Исследования показывают, что современные исследователи сталкиваются с серьезными трудностями при обработке огромного объема научной информации. Постоянно растущее количество публикаций приводит к перегрузке, что затрудняет выявление действительно значимых результатов и выстраивание целостной картины по интересующей теме. Синтез информации из множества статей требует значительных временных затрат и когнитивных усилий, что существенно снижает эффективность исследовательских процессов. Вместо углубленного анализа, ученые зачастую вынуждены ограничиваться поверхностным ознакомлением с материалами, что может приводить к упущению важных деталей и неверным выводам. Это подчеркивает необходимость разработки новых инструментов и подходов, способных облегчить процесс синтеза знаний и помочь исследователям эффективно ориентироваться в море научной литературы.

Существующие инструменты академического поиска зачастую закреплены за устоявшимися парадигмами, что приводит к феномену, известному как «функциональная зафиксированность». Это когнитивное искажение препятствует исследователям в рассмотрении альтернативных, потенциально более эффективных методов поиска и анализа информации. Вместо того, чтобы адаптироваться к новым потребностям и технологиям, многие системы продолжают полагаться на традиционные подходы, такие как простое сопоставление ключевых слов. В результате, исследователи могут быть ограничены в своем исследовании, не осознавая возможности более глубокого и всестороннего анализа научных работ, что замедляет процесс открытия и инноваций.

Анализ запросов пользователей показал преобладание ключевых слов, при этом пользователи Asta чаще формулируют запросы естественным языком, а пользователи S2 склонны к запросам, направленным на поиск конкретных работ или общее исследование, подробности представлены в таблицах 6 и 7.

Asta: Инструменты Искусственного Интеллекта для Семантического Понимания

Платформа Asta предлагает два основных интерфейса — PaperFinder и ScholarQA — разработанных для улучшения исследовательского опыта за счет использования методов извлечения и синтеза информации на основе больших языковых моделей (LLM). PaperFinder предназначен для предоставления ранжированных списков научных публикаций с краткими аннотациями, облегчая поиск релевантной литературы. ScholarQA, в свою очередь, генерирует структурированные отчеты, отвечающие на конкретные научные вопросы, предоставляя синтезированные ответы, основанные на анализе нескольких источников. Оба интерфейса используют возможности Semantic Scholar для первоначального поиска документов, а затем применяют LLM для уточнения результатов и создания обобщенных выводов.

Интерфейс PaperFinder предоставляет отранжированный список научных публикаций, сопровождаемый краткими информативными аннотациями для быстрого ознакомления с содержанием. В отличие от него, ScholarQA формирует структурированные отчеты, непосредственно отвечающие на поставленные научные вопросы. Эти отчеты синтезируют информацию из различных источников, предоставляя пользователю готовые ответы, а не просто список релевантных документов. Таким образом, PaperFinder ориентирован на поиск и предварительный просмотр публикаций, а ScholarQA — на получение конкретных ответов и аналитических обзоров.

Оба интерфейса, PaperFinder и ScholarQA, используют Semantic Scholar в качестве первичного источника для поиска документов. Однако, в отличие от прямого использования результатов Semantic Scholar, они применяют большие языковые модели (LLM) для дальнейшей обработки. LLM используются для уточнения релевантности найденных документов, фильтрации нерелевантных результатов и, что наиболее важно, для синтеза информации из нескольких источников. Этот синтез позволяет генерировать краткие обзоры (в PaperFinder) или структурированные ответы на конкретные научные вопросы (в ScholarQA), предоставляя пользователю не просто список статей, а уже обработанные и обобщенные знания.

Распределение интентов запросов по различным областям знаний в Asta отражает типичные исследовательские задачи, характерные для каждой области.

Анализ Поведения Пользователей с Использованием Набора Данных Asta Interaction Dataset

Набор данных ‘Asta Interaction Dataset’ представляет собой масштабную запись анонимизированного поведения пользователей, включающую данные о продолжительности сеанса (‘Session Duration’), критериях поиска (‘Search Criteria’) и других ключевых метриках. Этот набор данных содержит информацию о более чем 200 000 запросах, что позволяет проводить статистически значимые исследования паттернов взаимодействия пользователей с сервисами. Данные собирались с целью анализа эффективности поиска и улучшения пользовательского опыта, а также для выявления тенденций в информационном поведении пользователей.

Анализ данных набора Asta Interaction Dataset показывает, что взаимодействие пользователей с платформами PaperFinder и ScholarQA существенно различается в зависимости от их уровня опыта, классифицируемого по стадиям освоения. Начинающие пользователи, как правило, демонстрируют более короткую продолжительность сессий и склонны к использованию PaperFinder для общих поисковых запросов. Опытные пользователи, напротив, чаще обращаются к ScholarQA для получения структурированной информации по сложным темам, что проявляется в более длительных сессиях и более глубоком взаимодействии с платформой. Выделенные стадии пользовательского опыта позволяют сегментировать аудиторию и адаптировать функциональность платформ для повышения эффективности поиска и удовлетворенности пользователей.

Анализ данных Asta Interaction Dataset выявил корреляцию между запросами, выражающими потребность в абстрактном понимании темы (“Abstract Intent”), и повышенной вовлеченностью пользователей в ScholarQA. В частности, медианная длительность сессии для PaperFinder составляет 4 минуты, в то время как для ScholarQA этот показатель достигает 8 минут. Это указывает на то, что пользователи, формулирующие запросы, требующие концептуального осмысления, склонны к более длительному взаимодействию с платформой ScholarQA, вероятно, из-за её способности предоставлять структурированные ответы на сложные вопросы.

По мере взаимодействия с системой наблюдается снижение кликабельности отчетов PF (Personalized Feedback) и рост вовлеченности пользователей в отчеты SQA (Search Quality Assessment), вероятно, из-за пассивного характера PF и необходимости клика для доступа к контенту SQA, что отражено на графике с 95% доверительным интервалом.

Количественная Оценка Вовлеченности: Коэффициент Кликабельности и За Его Пределами

Коэффициент кликабельности (CTR) на краткие обзоры отчетов, генерируемые системой Asta, выступает ключевым показателем вовлеченности пользователей и релевантности синтезированной информации. Этот показатель позволяет оценить, насколько успешно система представляет сжатые версии научных материалов, вызывая интерес и побуждая к дальнейшему изучению. Высокий CTR свидетельствует о том, что обзоры точно отражают суть исследований и соответствуют запросам пользователей, тогда как низкий CTR может указывать на необходимость улучшения алгоритмов синтеза или повышения точности соответствия запросам. Анализ CTR в сочетании с другими метриками позволяет оценить эффективность Asta в предоставлении пользователям доступа к наиболее значимой информации, сокращая время на поиск и повышая продуктивность научных исследований.

Анализ показателей кликабельности по различным типам запросов и уровню опыта пользователей позволяет выявить сильные и слабые стороны интерфейсов Asta. Исследование демонстрирует, что эффективность представления информации варьируется в зависимости от сложности запроса и степени знакомства пользователя с системой. Например, более простые запросы, как правило, приводят к более высокой кликабельности, что указывает на успешную обработку очевидных потребностей в информации. В то же время, анализ поведения опытных пользователей помогает оптимизировать интерфейс для более сложных запросов, требующих детального изучения и синтеза информации. Такой подход к анализу данных позволяет целенаправленно улучшать пользовательский опыт и повышать эффективность поиска релевантных научных материалов, что является ключевым фактором для успешного использования AI-инструментов в научной сфере.

Анализ повторных посещений сгенерированных отчетов демонстрирует, что пользователи воспринимают результаты ScholarQA и PaperFinder не как одноразовую выдачу, а как ценные и устойчивые источники информации: показатель повторных посещений для ScholarQA составляет 50.5%, а для PaperFinder — 42.1%. Примечательно, что почти 18.8% пользователей уточняют свои запросы после первого получения результатов, что свидетельствует о процессе итеративного исследования и углубленного изучения научной литературы. Это указывает на то, что инструменты, основанные на искусственном интеллекте, способствуют не только быстрому доступу к информации, но и стимулируют более детальное и вдумчивое взаимодействие с научными данными.

Анализ данных, полученных в ходе использования инструментов на базе искусственного интеллекта, демонстрирует значительный потенциал для трансформации научной сферы. Подобные технологии позволяют исследователям получать доступ к синтезированным знаниям с беспрецедентной скоростью и эффективностью, существенно сокращая время, необходимое для обзора литературы и выявления ключевых тенденций. Это, в свою очередь, способствует ускорению темпов научных открытий и повышению продуктивности исследований. Наблюдаемая тенденция к повторному обращению к сгенерированным отчетам и итеративному уточнению запросов подтверждает, что пользователи воспринимают эти инструменты не как одноразовые источники информации, а как ценные помощники в процессе научного поиска и анализа, способствующие более глубокому и всестороннему пониманию исследуемой темы.

Анализ использования функций показал, что расширение секций является наиболее распространенным действием как в PF, так и в SQA, вероятно, из-за необходимости клика для отображения полного текста, при этом клики по ссылкам значительно преобладают над обратной связью в виде лайков/дизлайков и тесно связаны с удовлетворённостью пользователей.

Исследование взаимодействия ученых с системами искусственного интеллекта, представленное в данной работе, демонстрирует, что эффективное использование таких инструментов требует не только совершенства алгоритмов, но и глубокого понимания того, как исследователь формулирует свои запросы и интерпретирует полученные ответы. Анализ логов взаимодействия, представленный в Asta Interaction Dataset, позволяет увидеть, что процесс научного поиска редко бывает линейным и часто включает в себя итеративные уточнения и переосмысления. В связи с этим, уместно вспомнить слова Дональда Кнута: «Прежде чем оптимизировать код, убедитесь, что он работает правильно». Эта фраза, хоть и относится к программированию, прекрасно иллюстрирует важность понимания фундаментальных принципов взаимодействия человека и машины, прежде чем стремиться к повышению эффективности. Подобно тому, как нельзя оптимизировать неработающий код, нельзя эффективно использовать инструмент, не понимая, как исследователь взаимодействует с ним и какие цели преследует.

Что дальше?

Представленный набор данных, фиксирующий взаимодействие исследователей с интеллектуальным помощником, лишь запечатлевает момент. Каждая зафиксированная строка запроса, каждая оценка релевантности — это эхо прошлого, отражение текущих представлений о научном поиске. Полезность таких инструментов, несомненно, измерима в краткосрочной перспективе, но истинная проверка придёт с временем, когда станет ясно, какие абстракции выдержали испытание реальностью, а какие — оказались мимолетными удобствами.

Необходимо признать, что анализ поведения пользователей — это всегда взгляд в заднее зеркало. Настоящая задача заключается не в оптимизации существующих интерфейсов, а в предвидении эволюции исследовательских стратегий. Какие новые формы запросов возникнут, когда исследователи освоят возможности этих систем? Как изменится само определение «релевантности», когда алгоритмы начнут предвосхищать потребности, а не просто отвечать на вопросы? В конечном счете, устойчивость научного поиска определяется не скоростью обработки данных, а способностью адаптироваться к меняющемуся ландшафту знаний.

Этот набор данных — отправная точка, но не финал. Следующим шагом должно стать долгосрочное наблюдение, отслеживание влияния этих инструментов на структуру научных работ, на формирование гипотез, на саму природу научного открытия. И лишь тогда можно будет оценить, внесли ли эти системы вклад в устойчивый прогресс, или оказались лишь очередным эпизодом в бесконечном цикле технологических инноваций.

Оригинал статьи: https://arxiv.org/pdf/2602.23335.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-27 13:59

🚀 Квантовые новости