Автор: Денис Аветисян
Представлена система InternAgent-1.5, способная к автономным научным исследованиям и экспериментам на основе структурированной памяти.
InternAgent-1.5 — унифицированная агентная платформа для долгосрочных научных открытий, демонстрирующая передовые результаты в алгоритмических и эмпирических областях.
Несмотря на значительный прогресс в области искусственного интеллекта, автоматизация полноценного научного поиска остается сложной задачей. В данной работе представлена система ‘InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery’ — унифицированная агентная система, включающая модули генерации, верификации и эволюции, способная к длительным циклам автономных исследований. Система демонстрирует передовые результаты в решении научных задач, включая разработку алгоритмов и проведение как вычислительных, так и лабораторных экспериментов в различных областях науки. Может ли InternAgent-1.5 стать основой для нового поколения интеллектуальных помощников, способных самостоятельно совершать научные открытия?
Преодолевая Ограничения Традиционной Науки
Традиционные научные методы, несмотря на свою эффективность, зачастую характеризуются высокой степенью зависимости от опыта и знаний квалифицированных специалистов. Это приводит к тому, что процесс научных исследований может быть длительным и требовать значительных ресурсов — как финансовых, так и временных. Например, для проведения сложных экспериментов, анализа полученных данных и формулировки обоснованных выводов необходимы годы кропотливой работы, а также дорогостоящее оборудование и реактивы. Особенно остро эта проблема проявляется в областях, требующих глубокой специализации и уникального опыта, что замедляет темпы научных открытий и инноваций. В связи с этим, актуальным направлением исследований является разработка автоматизированных систем, способных частично или полностью заменить человека в рутинных задачах и ускорить процесс получения новых знаний.
Современные системы искусственного интеллекта демонстрируют впечатляющую способность к распознаванию закономерностей в больших объемах данных, однако сталкиваются с серьезными трудностями при выполнении сложного логического мышления и обобщения, необходимых для настоящих научных открытий. В отличие от человека, способного к интуиции и творческому подходу, ИИ зачастую ограничен рамками заданных алгоритмов и не может самостоятельно строить гипотезы или экстраполировать полученные знания на новые, неизученные области. Эта проблема особенно актуальна при исследовании сложных систем, где взаимосвязи между элементами нелинейны и требуют глубокого понимания принципов работы, а не просто выявления статистических корреляций. В результате, несмотря на значительные успехи в узкоспециализированных задачах, ИИ пока не способен заменить ученого в процессе фундаментальных научных исследований, требующих критического мышления и способности к генерации новых идей.
Существующие оценочные критерии и наборы данных для искусственного интеллекта зачастую не отражают всей сложности и тонкостей, присущих передовым научным задачам. Это приводит к тому, что системы ИИ, успешно справляющиеся с тестами, оказываются неспособными к реальным научным открытиям и обобщениям. Проблема заключается в том, что большинство бенчмарков сосредоточены на проверке способности к распознаванию шаблонов, игнорируя необходимость критического мышления, формулирования гипотез и интерпретации неоднозначных данных — навыков, критически важных для прорывных исследований. В результате, прогресс в области ИИ, направленного на научные открытия, замедляется, поскольку существующие инструменты оценки не позволяют адекватно оценить и улучшить способность систем к действительно творческому и инновационному научному мышлению.
InternAgent-1.5: Интегрированная Система Научных Исследований
InternAgent-1.5 представляет собой интегрированную систему, предназначенную для осуществления полного цикла научных исследований, объединяя этапы генерации гипотез, их экспериментальной проверки и последующей эволюции знаний в едином фреймворке. В отличие от традиционных подходов, где эти этапы разрознены и требуют ручного взаимодействия, InternAgent-1.5 автоматизирует весь процесс, обеспечивая непрерывную итерацию между формулированием новых предположений, проведением необходимых экспериментов и анализом полученных данных для уточнения или отбрасывания гипотез. Это позволяет значительно ускорить темпы научных открытий и повысить эффективность исследований, особенно в областях, требующих обработки больших объемов информации и проведения сложных экспериментов.
В основе InternAgent-1.5 лежит “Структурированная Когнитивная Память” — иерархическая система, включающая три основных типа памяти. Задача-Эпизодическая память хранит конкретные опыты и последовательности действий, относящиеся к решению определенных задач. Семантическая-Знаниевая память содержит факты, концепции и общие знания о мире, необходимые для интерпретации данных и формулирования гипотез. Наконец, Стратегия-Процедурная память фиксирует методы и алгоритмы решения задач, позволяя системе адаптировать и совершенствовать свои подходы на основе накопленного опыта, что обеспечивает устойчивое обучение и адаптивное усовершенствование.
В основе InternAgent-1.5 лежит интеграция больших языковых моделей (LLM) с автоматизированными инструментами для проведения научных исследований. LLM используются для синтеза существующих знаний, извлечения релевантной информации из научных публикаций и формирования гипотез. Автоматизированные инструменты, в свою очередь, позволяют проектировать эксперименты, управлять лабораторным оборудованием, собирать и анализировать данные. Этот комплексный подход обеспечивает автоматизацию ключевых этапов научного процесса — от выдвижения гипотезы до получения и интерпретации результатов, существенно ускоряя темпы научных открытий и снижая зависимость от ручного труда исследователей.
Автоматизированные Процессы Открытия и Уточнения
InternAgent-1.5 использует возможности “Уточнения решений” (Solution Refinement), представляющие собой итеративный процесс улучшения предлагаемых экспериментов и оптимизации научных методологий. Данная функциональность позволяет системе, после проведения первоначального эксперимента, анализировать полученные результаты и автоматически корректировать параметры последующих экспериментов для достижения более точных или эффективных результатов. Итеративный характер процесса имитирует стандартную научную практику, где гипотезы проверяются, а затем уточняются на основе эмпирических данных, обеспечивая постоянное улучшение научной методологии и повышение достоверности получаемых результатов. Алгоритмы уточнения решений направлены на минимизацию ошибок и оптимизацию использования ресурсов, таких как время и материалы, в процессе научных исследований.
В системе InternAgent-1.5 реализовано автоматическое обнаружение и оптимизация алгоритмов посредством AutoML (Automated Machine Learning). Это позволяет системе самостоятельно разрабатывать и настраивать алгоритмы для решения конкретных научных задач, избегая необходимости ручного проектирования и тюнинга. Автоматизированный процесс включает в себя поиск оптимальной архитектуры алгоритма, выбор наиболее подходящих гиперпараметров и оценку производительности на заданном наборе данных. Используемые методы включают в себя генетические алгоритмы, байесовскую оптимизацию и reinforcement learning, что обеспечивает эффективный поиск оптимальных решений для широкого спектра научных проблем.
Система InternAgent-1.5 использует механизм “Долговременной памяти” (Long Horizon Memory) для сохранения контекста в течение продолжительных исследовательских проектов. Этот механизм позволяет системе поддерживать согласованность и преемственность в процессе решения сложных задач, сохраняя информацию о предыдущих этапах исследования, промежуточных результатах и принятых решениях. Реализация включает в себя структурированное хранение данных, позволяющее системе восстанавливать и использовать релевантную информацию для поддержки дальнейшего концептуального развития и проведения сложных умозаключений, необходимых для эффективного научного поиска.
Расширение Горизонтов Научного Поиска
InternAgent-1.5 демонстрирует выход за рамки традиционных оценочных тестов, проявляя компетентность в анализе научных данных, охватывающих широкий спектр дисциплин, включая биологию, физику и науки о Земле. Система способна к самостоятельному решению сложных задач, требующих не просто воспроизведения заученных ответов, а глубокого понимания научных принципов и умения извлекать значимые выводы из разнообразных источников информации. Такая способность к всестороннему научному анализу позволяет InternAgent-1.5 эффективно работать с данными различного формата и сложности, автоматизируя ключевые этапы исследовательского процесса и открывая новые возможности для научных открытий в различных областях знаний.
Система InternAgent-1.5 демонстрирует значительный прогресс в решении сложных научных задач, существенно превосходя существующие аналоги в ключевых бенчмарках. В ходе тестирования на SGI-Bench, система достигла 37.74% в задаче глубокого научного исследования, что более чем вдвое превышает результат Gemini-3-pro (18.48%). Не менее впечатляющим является результат в 58.11% в задаче генерации научных идей, где InternAgent-1.5 опережает GPT-5 (55.40%). Эти достижения свидетельствуют о способности системы эффективно решать задачи, требующие не только доступа к обширным знаниям, но и способности к критическому анализу и инновационному мышлению на передовом уровне академических исследований.
Система InternAgent-1.5 демонстрирует потенциал для значительного ускорения научных открытий и получения новых знаний в различных областях. Подтверждением этого служат впечатляющие результаты, достигнутые в ряде сложных задач: точность в 40.87% в тесте HLE превосходит показатели Gemini-3-pro-preview, а лидерство в FrontierScience с результатом 77.20% значительно превышает эффективность DeepSeek-V3.2-Thinking (64.70%). Кроме того, InternAgent-1.5 установила новые стандарты в решении задач GPQA-diamond (87.37% точности), ChemCoTBench (top-1 точность 0.86, превосходя o3-mini и Gemini-3-Pro-Thinking) и AutoTSF (низкое значение RMSE — 0.8488, обгоняя Kriging и BCSD), что свидетельствует о ее способности автоматизировать ключевые этапы научного процесса и расширять границы текущих возможностей.
Исследование, представленное в статье, демонстрирует, что системы искусственного интеллекта, подобные InternAgent-1.5, способны к автономному научному открытию, требующему длительного горизонта планирования и структурированной памяти. Этот подход, позволяющий агенту эффективно оперировать знаниями и проводить эксперименты, напоминает о сложности и изменчивости самих систем. Как однажды заметил Алан Тьюринг: «Я не заинтересован в создании умных машин, а в понимании интеллекта». Развитие InternAgent-1.5, с его акцентом на долгосрочную память и автоматизацию исследований, является шагом к более глубокому пониманию интеллекта — как искусственного, так и естественного. Подобно тому, как эрозия формирует ландшафт, технический долг может влиять на производительность системы, а поддержание высокого аптайма требует постоянных усилий для сохранения её гармонии во времени.
Что дальше?
Представленная работа, демонстрируя возможности InternAgent-1.5, лишь временно отсрочила неизбежное. Любой, даже самый тщательно спроектированный агент, столкнется с энтропией данных и неполнотой знаний. Успехи в автоматизированном научном поиске — это не достижение стабильности, а лишь временное кэширование информации во времени. Основной вызов заключается не в увеличении объема обрабатываемых данных, а в разработке систем, способных достойно стареть, извлекать смысл из шума и адаптироваться к постоянно меняющемуся ландшафту научных парадигм.
Особое внимание следует уделить не столько оптимизации скорости запросов, сколько снижению «налога задержки» — неизбежной платы за сложность и глубину анализа. Долгосрочная память, хотя и продемонстрирована, остается хрупкой конструкцией. Будущие исследования должны быть направлены на создание самовосстанавливающихся и самообучающихся систем, способных преодолевать когнитивные искажения и находить неочевидные связи.
В конечном счете, задача состоит не в создании «идеального ученого», а в разработке инструментов, которые позволят человеческому разуму расширить свои границы и достойно встретить неизбежность старения, используя время не как ограничение, а как среду для непрерывного обучения и открытия.
Оригинал статьи: https://arxiv.org/pdf/2602.08990.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Квантовая суперпозиция: новая интерпретация вероятности
- Ускорение генеративных моделей: новый подход к вычислению матричной экспоненты
- Эффективный параллелизм: iCIPT2 на службе квантифицируемой химии
- Ускорение вычислений: Монте-Карло и линейные системы
- Квантовый скачок: от лаборатории к рынку
- Тензорные сети и комбинаторные поиски: новый подход к сложным задачам
- Квантовая геометрия управления: плавные траектории в пространстве состояний
- Адаптация моделей к новым данным: квантильная коррекция для нейросетей
2026-02-10 11:20