Память как лес: новая архитектура для интеллектуальных агентов

Автор: Денис Аветисян

Исследователи представили MemForest — систему, оптимизирующую хранение и извлечение информации для долгосрочной работы интеллектуальных агентов.

MemTree воплощает временную область в виде иерархии, упорядоченной по времени: листья сохраняют локальные данные, внутренние узлы суммируют интервалы, а корень обеспечивает грубый поиск, при этом единая структура поддерживает локальную вставку, обновление путей изменения и иерархическое извлечение.

MemForest использует иерархическую временную индексацию для повышения эффективности записи и масштабируемости системы памяти.

Эффективное управление памятью является критическим вызовом для создания долгосрочных агентов на базе больших языковых моделей (LLM). В данной работе, ‘MemForest: An Efficient Agent Memory System with Hierarchical Temporal Indexing’, представлена новая архитектура памяти, MemForest, которая решает проблему масштабируемости и задержек, возникающих при обновлении состояний агента. MemForest использует иерархический временной индекс (MemTree) и параллельную обработку фрагментов данных для обеспечения высокой скорости записи и сохранения временной последовательности состояний. Позволит ли такой подход существенно расширить возможности LLM-агентов в сложных и динамичных средах?

Вызов Стабильной Памяти для Интеллектуальных Агентов

Для эффективной работы агентов на базе больших языковых моделей (LLM) необходимы надежные системы памяти, позволяющие сохранять контекст и состояние на протяжении продолжительных взаимодействий. В отличие от простых запросов-ответов, сложные диалоги и задачи требуют от агента запоминать предыдущие этапы обсуждения, детализированную информацию о пользователе и текущие цели. Отсутствие такой памяти приводит к потере связности, повторению вопросов и неспособности к выполнению многоэтапных задач. Поэтому разработка эффективных и масштабируемых систем памяти является ключевой проблемой в создании действительно интеллектуальных и полезных LLM-агентов, способных поддерживать сложные и продолжительные взаимодействия с пользователями.

Традиционные методы сохранения контекста в диалоговых системах, основанные на хранении и извлечении больших объемов информации, сталкиваются с серьезными ограничениями в скорости обработки и масштабируемости. При увеличении продолжительности беседы и сложности задач, задержки, связанные с доступом к памяти, становятся критическими, ухудшая пользовательский опыт. Кроме того, поддержание работоспособности таких систем при одновременном обслуживании большого числа пользователей требует значительных вычислительных ресурсов и усложняет инфраструктуру. Данные ограничения подчеркивают необходимость разработки новых подходов к управлению состоянием агентов, способных обеспечивать быстродействие и масштабируемость, необходимые для поддержания длительных и содержательных диалогов.

В типичной системе памяти агента, новый диалог проходит этап извлечения информации, затем происходит обновление поддерживаемого состояния памяти, а последующие запросы запускают процесс извлечения необходимых данных.

Архитектура MemForest: Эффективная Память Временных Данных

MemForest — это новая архитектура памяти, разработанная для повышения эффективности записи временных данных. Она сочетает в себе параллельную экстракцию чанков (chunks) и каноническую консолидацию фактов. Параллельная экстракция чанков позволяет обрабатывать данные одновременно, сокращая время записи. Каноническая консолидация фактов обеспечивает согласованность и надежность хранимой информации, устраняя дубликаты и разрешая конфликты. Такое сочетание позволяет MemForest существенно снизить накладные расходы, связанные с записью и обновлением временных данных, по сравнению с традиционными подходами к организации памяти.

Архитектура MemForest использует иерархический временной индекс, MemTree, для материализации ограниченной области памяти в виде упорядоченных по времени деревьев. Данная структура позволяет эффективно индексировать и извлекать данные, поскольку временная последовательность событий представлена в древовидной форме, что оптимизирует поиск по времени. Каждый узел дерева содержит информацию о временном интервале и указатели на дочерние узлы, представляющие более детализированные временные поддиапазоны. Такая организация обеспечивает быстрый доступ к данным, пропорциональный $O(log n)$ , где n — количество временных точек, что существенно превосходит линейную сложность традиционных методов доступа к временным данным.

Параллельная экстракция чанков (Parallel Chunk Extraction) значительно ускоряет обработку данных за счет одновременного выделения и предварительной обработки поступающих данных, минимизируя задержки и повышая пропускную способность системы. В то же время, каноническая консолидация фактов (Canonical Fact Consolidation) обеспечивает согласованность и надёжность хранимой информации путем устранения дубликатов, разрешения конфликтов и применения строгой проверки целостности данных перед их сохранением в долговременную память. Этот процесс гарантирует, что каждый факт представлен в едином, каноническом виде, что упрощает последующий поиск и анализ данных, а также повышает общую устойчивость системы к ошибкам и несоответствиям.

Архитектура MemForest позволяет извлекать сессии в канонические факты, направлять их к специализированным MemTrees и поддерживать актуальность производных артефактов посредством селективного обновления, при этом поиск релевантных деревьев и переход от интервальных сводок к конкретным доказательствам дополняется опциональным планировщиком.

Валидация Эффективности: Сравнение с Ведущими Системами

Для оценки эффективности MemForest проводилось сравнение с устоявшимися системами долговременной памяти — EverMemOS, LightMem и MemoryOS — на стандартных бенчмарк-датасетах, предназначенных для тестирования работы с длинным контекстом. Выбор данных был обусловлен необходимостью объективной оценки производительности MemForest в задачах, требующих обработки и хранения больших объемов информации. В процессе сравнения оценивались ключевые показатели, такие как точность ответа и задержка записи, что позволило выявить преимущества MemForest перед существующими решениями в данной области.

В ходе оценки MemForest по сравнению с существующими системами управления памятью — EverMemOS, LightMem и MemoryOS — на наборах данных для длинного контекста, была продемонстрирована стабильная превосходящая производительность. В частности, достигнута точность pass@1 в 79.8% на наборе данных LongMemEval-S, что является наивысшим показателем на данный момент. Данный результат подтверждает, что MemForest устанавливает новый стандарт производительности в задачах, требующих работы с длинным контекстом, и превосходит существующие решения по ключевым показателям точности.

В ходе тестирования MemForest продемонстрировал значительное ускорение операций записи — до 13.7x по сравнению с базовыми системами, такими как EverMemOS, LightMem и MemoryOS. При этом, сохранялась высокая точность ответов. Оценка производительности осуществлялась на двух ключевых наборах данных: LongMemEval-S и LoCoMo, что позволило провести всестороннюю проверку возможностей системы в различных сценариях и обеспечить надежность полученных результатов.

В ходе тестирования Qwen3-30B на LongMemEval-S, MemForest продемонстрировал улучшение баланса между скоростью обновления и точностью, при этом основная задержка связана с операциями записи и поддержки долгосрочной памяти.

Расширение Горизонтов Памяти Агентов: Новый Уровень Интеллекта

Архитектура MemForest обеспечивает эффективный поиск информации благодаря своей иерархической структуре, напоминающей древовидную организацию данных. Вместо линейного перебора всей истории взаимодействия, система разбивает информацию на уровни абстракции, позволяя быстро локализовать релевантные фрагменты. Этот процесс дополнительно усиливается благодаря LLM-guided Browse — направленному поиску, осуществляемому с помощью большой языковой модели. Модель выступает в роли интеллектуального навигатора, анализируя запрос и определяя наиболее перспективные ветви иерархии для поиска. Такой подход значительно снижает время отклика и повышает точность извлечения информации, позволяя агентам эффективно использовать накопленный опыт для принятия решений и поддержания содержательной беседы.

В основе эффективной работы агентов, способных к длительному взаимодействию, лежит возможность быстрого доступа к информации о предыдущих этапах беседы. Именно поэтому разработана система, объединяющая временную индексацию и иерархический поиск. Временная индексация позволяет упорядочить данные по моменту их возникновения, а иерархический поиск — структурировать их по значимости и категориям. Такая комбинация обеспечивает не просто хранение истории взаимодействий, но и возможность мгновенно извлекать релевантную информацию, необходимую для поддержания контекста и логичного продолжения диалога. Это особенно важно для сложных задач, требующих от агента последовательного рассуждения и учета предыдущих шагов, поскольку позволяет ему оперировать не только текущими данными, но и накопленным опытом, что значительно повышает качество принимаемых решений и общую эффективность работы.

Архитектура MemForest позволяет языковым моделям-агентам демонстрировать более тонкое и последовательное поведение в ходе продолжительных взаимодействий, значительно повышая их практическую ценность. Благодаря эффективному доступу к историческим данным, агенты способны учитывать контекст предыдущих шагов, что приводит к более осмысленным ответам и действиям. Исследования показали, что такая организация памяти не только улучшает качество взаимодействия, но и обеспечивает повышенную производительность — увеличивая скорость обработки запросов и одновременно снижая задержки при записи новой информации, что особенно важно для приложений, требующих оперативной реакции и масштабируемости.

Диагностика масштабируемости MemTree показывает, что пакетное обновление меток снижает количество запросов для обобщения, время сборки растёт умеренно с увеличением количества фактов, параллельная запись на уровень обеспечивает более высокую скорость обработки больших деревьев, а пропускная способность обобщения и точность извлечения данных достигают пика при умеренном коэффициенте ветвления, что обосновывает настройки по умолчанию в MemForest.

Исследование, представленное в данной работе, демонстрирует стремление к созданию эффективных систем управления памятью для LLM-агентов. Подход MemForest, с его акцентом на канонические факты и временную индексацию, подчеркивает важность структурирования данных для обеспечения производительности и масштабируемости. Как однажды заметила Барбара Лисков: «Хорошая абстракция позволяет вам изменить внутреннюю реализацию, не затрагивая код, который ее использует». Это высказывание находит отражение в MemForest, где иерархическая структура и локальное обслуживание памяти позволяют агенту адаптироваться к изменяющимся данным, сохраняя при этом целостность и эффективность. Подобный дизайн, ориентированный на простоту и ясность, способствует созданию надежных и устойчивых систем, где архитектура незаметна, пока не ломается, и только тогда видна настоящая цена решений.

Куда Ведет Лес Памяти?

Представленная архитектура MemForest, несомненно, демонстрирует элегантность в стремлении к эффективной записи и сохранению временной последовательности. Однако, как и в любом живом организме, решение одной задачи неизбежно обнажает другие. Вопрос не в том, насколько быстро можно записать факт, а в том, как долго он останется релевантным, и как система сможет отличить истину от эха. Устойчивость такой системы не в усложнении иерархий, а в четкости границ между ними.

Очевидно, что будущие исследования должны быть направлены на самоорганизацию этой «памяти». Невозможно полагаться на жестко заданные структуры; необходимо, чтобы система сама определяла значимость информации, отсекая избыточное и укрепляя ключевые связи. В противном случае, лес неизбежно затянется бурьяном, а поиск истины станет невозможным. Важно исследовать, как принципы адаптации и обучения могут быть интегрированы в саму архитектуру памяти.

В конечном счете, MemForest — это лишь шаг на пути к созданию действительно разумных агентов. Проблема не в количестве хранимой информации, а в ее качестве и способности к генерации нового знания. Истинная эффективность заключается не в скорости записи, а в мудрости хранения и использования.

Оригинал статьи: https://arxiv.org/pdf/2605.23986.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-05-26 18:20

🚀 Квантовые новости