Таблицы под контролем: новая система для интеллектуального поиска и ответов

Автор: Денис Аветисян

Исследователи представили SQuARE — систему, которая умеет находить ответы на вопросы в таблицах, выбирая оптимальный подход в зависимости от сложности данных.

Роутер, выбирая между фрагментами и ограниченным SQL, а шлюз уверенности переключаясь или объединяя при слабом контексте, демонстрирует вариативность точности в зависимости от задачи и модели, где более тёмные ячейки указывают на превосходство, а выделенная строка обозначает лидера по результатам.

SQuARE использует адаптивную маршрутизацию запросов к табличным данным, комбинируя поиск по структурированным фрагментам и SQL-запросы для повышения точности и обеспечения проверяемости ответов на уровне ячеек.

Несмотря на прогресс в области обработки естественного языка, точный анализ вопросов по табличным данным, таким как электронные таблицы, остается сложной задачей из-за неоднородности структуры и сложности схем. В данной работе представлена система SQuARE: Structured Query & Adaptive Retrieval Engine For Tabular Formats, гибридный фреймворк, который динамически направляет запросы к таблицам либо через извлечение структурированных фрагментов, либо через SQL-запросы, основываясь на сложности структуры листа. Такой подход позволяет повысить точность ответов и обеспечить их проверяемость, предоставляя информацию на уровне отдельных ячеек. Сможет ли SQuARE стать основой для создания более надежных систем понимания табличных данных и интеграции с новыми табличными моделями?

Трудности анализа табличных данных: предзнаменование сбоя

Традиционные методы извлечения информации сталкиваются со значительными трудностями при работе с табличными данными, выходящими за рамки простых плоских структур. Исторически сложившиеся подходы, ориентированные на последовательную обработку строк и столбцов, оказываются неэффективными при анализе таблиц, содержащих многоуровневые заголовки, объединенные ячейки или сложные взаимосвязи между данными. Это связано с тем, что такие таблицы требуют понимания не только содержимого каждой ячейки, но и её контекста внутри общей структуры. В результате, информация, закодированная в сложных таблицах, часто остается недоступной для автоматизированных систем, что снижает точность и полноту получаемых результатов. Проблему усугубляет тот факт, что большинство существующих алгоритмов не способны эффективно распознавать и интерпретировать сложные взаимосвязи между данными, представленными в нелинейном формате.

Современные таблицы данных всё чаще отличаются сложной структурой, включающей многоуровневые заголовки и объединенные ячейки. Это представляет значительную проблему для извлечения информации, поскольку традиционные методы анализа не способны эффективно учитывать эти особенности. Такие структуры требуют разработки принципиально новых подходов к доступу к данным, позволяющих корректно интерпретировать взаимосвязи между элементами таблицы и обеспечивать точное извлечение необходимых сведений. В частности, необходимо учитывать иерархию заголовков и понимать, как объединение ячеек влияет на семантическое значение данных, что является критически важным для автоматизированного анализа и обработки табличной информации.

Существующие методы извлечения информации часто оказываются неспособны адекватно отразить внутреннюю структуру и взаимосвязи в сложных табличных данных, что приводит к неточностям в результатах. Исследования показывают, что даже передовые модели, такие как ChatGPT-4o, демонстрируют лишь 28,7% точность при анализе сложных балансовых отчетов. Эта низкая результативность обусловлена тем, что стандартные алгоритмы не учитывают многоуровневые заголовки, объединенные ячейки и другие особенности, присущие сложным таблицам, что затрудняет понимание контекста и корректное извлечение данных. Неспособность адекватно интерпретировать структуру таблицы приводит к ошибкам в понимании взаимосвязей между данными и, как следствие, к неверным ответам и выводам.

Анализ баланса Microsoft за 2020-2024 годы демонстрирует, что для точного извлечения данных, таких как денежные средства и основные средства, необходимо сохранять структуру документа, включая заголовки, метки годов и единицы измерения, что обуславливает необходимость классификации по нескольким заголовкам и сохранения структуры при поиске.

SQuARE: Гибридный подход к запросам к таблицам

SQuARE — это новый фреймворк, предназначенный для интеллектуальной маршрутизации запросов к таблицам данных в зависимости от их сложности. В отличие от традиционных подходов, применяющих единый метод обработки, SQuARE анализирует структуру таблицы и динамически выбирает оптимальную стратегию. Этот процесс позволяет системе адаптироваться к различным типам таблиц, от простых списков до сложных взаимосвязанных структур, и повышает эффективность извлечения информации.

В основе SQuARE лежит метрика сложности, предназначенная для оценки структуры таблиц данных. Эта метрика анализирует характеристики таблицы, такие как количество строк и столбцов, наличие сложных взаимосвязей между данными и разнообразие типов данных. На основании полученного значения сложности система определяет оптимальную стратегию извлечения ответа: сохранение структуры данных при извлечении фрагментов (chunk retrieval) для простых таблиц или генерация SQL-запроса для более сложных таблиц. Такой подход позволяет использовать преимущества обоих методов: быстрое извлечение для простых случаев и точное извлечение информации, основанное на структуре данных, для сложных таблиц. Метрика сложности служит ключевым фактором для динамического выбора наиболее эффективной стратегии обработки запроса.

Гибридный подход SQuARE позволяет добиться значительного повышения точности ответов при работе со сложными табличными данными. В ходе тестирования, данная методика продемонстрировала улучшение точности до трех раз по сравнению с моделью ChatGPT-4o при решении задач, требующих анализа сложных электронных таблиц. Это достигается за счет комбинирования преимуществ двух стратегий: извлечения данных с сохранением структуры и генерации SQL-запросов, что позволяет эффективно обрабатывать разнообразные типы табличных вопросов и обеспечивать более надежные результаты.

Агентский маршрутизатор (Agentic Router) является ключевым компонентом системы SQuARE, отвечающим за динамический выбор оптимальной стратегии извлечения информации из таблиц. Он осуществляет анализ структуры таблицы в реальном времени, используя метрику сложности, и на основе этого анализа определяет, следует ли применять метод структурированного извлечения фрагментов (structure-preserving chunk retrieval) или генерировать SQL-запрос. Этот процесс позволяет системе адаптироваться к различным типам таблиц и запросов, обеспечивая максимальную точность ответов. Маршрутизатор действует как оркестратор, направляя каждый запрос к наиболее подходящему механизму извлечения данных, что позволяет эффективно использовать сильные стороны обоих подходов.

Соединение структуры и семантики

В рамках SQuARE реализован дифференцированный подход к извлечению данных из таблиц: для таблиц сложной структуры, характеризующихся наличием нескольких заголовков, применяется метод ‘Structure-Preserving Chunk Retrieval’, сохраняющий структуру данных при фрагментации. Для таблиц простой, “плоской” структуры, без сложных заголовков, используется генерация SQL-запросов (‘SQL Generation’), позволяющая напрямую обращаться к данным. Такой подход оптимизирует процесс извлечения информации, учитывая особенности организации данных в таблице.

В основе SQuARE лежит семантический индекс, предназначенный для повышения точности извлечения фрагментов данных. Этот индекс позволяет системе понимать значение и взаимосвязь между элементами в таблицах, а не просто сопоставлять текстовые строки. Благодаря семантическому анализу, система способна идентифицировать релевантный контекст, даже если запрос сформулирован неявно или использует синонимы. Это обеспечивает более точное извлечение необходимой информации из таблиц, особенно в сложных многозаголовочных структурах, где простой поиск по ключевым словам может оказаться неэффективным. Семантический индекс позволяет SQuARE учитывать смысл данных, а не только их форму, что значительно улучшает качество извлечения фрагментов по сравнению с традиционными методами.

Генерация SQL-запросов в SQuARE значительно улучшается благодаря использованию информации о схеме данных. Это позволяет системе эффективно ориентироваться в реляционных представлениях, созданных на основе таблиц, и извлекать необходимые данные. Осознание схемы данных обеспечивает точное сопоставление запросов с структурой таблиц, что повышает точность и эффективность извлечения информации по сравнению с подходами, не учитывающими структуру данных.

В ходе тестирования, фреймворк SQuARE продемонстрировал высокую точность обработки финансовых данных. На сложных балансовых отчетах SQuARE достиг 91.3% точности, что существенно превосходит результат ChatGPT-4o, составивший 28.7%. При работе с объединенным файлом данных Всемирного банка, SQuARE показал точность в 86.0%, в то время как ChatGPT-4o достиг всего 54.0%. Эти результаты подтверждают значительное превосходство SQuARE в задачах извлечения данных из структурированных табличных документов.

Расширение горизонтов извлечения

Система SQuARE представляет собой расширение существующих конвейеров ‘RAG’ (Retrieval-Augmented Generation), призванное значительно повысить надежность и адаптивность при работе с табличными данными. В отличие от традиционных подходов, SQuARE не заменяет существующие архитектуры, а интегрируется с ними, позволяя использовать различные методы извлечения информации, такие как ‘TableRAG’ и ‘TabRAG’, и направлять их работу посредством интеллектуальной маршрутизации. Это обеспечивает не только более точные ответы на запросы к таблицам, но и возможность адаптации к различным типам табличных структур и форматов данных, что делает систему особенно ценной в задачах анализа и обработки больших объемов структурированной информации.

Архитектура SQuARE демонстрирует высокую гибкость, позволяя бесшовно интегрировать существующие подходы к извлечению информации из таблиц, такие как TableRAG и TabRAG. Вместо полной замены этих систем, SQuARE выступает в роли интеллектуального маршрутизатора, направляя запросы к наиболее подходящей архитектуре RAG в зависимости от их сложности и специфики. Это позволяет использовать сильные стороны различных подходов — например, TableRAG может эффективно обрабатывать простые запросы, а SQuARE направляет более сложные запросы к TabRAG или другим специализированным системам. Такая модульная конструкция значительно повышает общую производительность и адаптируемость системы к разнообразным табличным данным и запросам пользователей, обеспечивая оптимальное решение для каждой конкретной задачи.

Архитектура SQuARE предоставляет возможность использования детерминированного поиска на основе SQL, что принципиально отличает её от традиционных подходов, полагающихся на вероятностные методы. Вместо приблизительного сопоставления и оценки релевантности, система формирует точные SQL-запросы к табличным данным, гарантируя, что каждый ответ подкреплен конкретным результатом запроса. Такой подход не только повышает точность получаемых ответов, но и обеспечивает их проверяемость — каждое утверждение может быть верифицировано путём повторного выполнения соответствующего SQL-запроса и анализа полученных данных. Это особенно важно в ситуациях, требующих высокой степени надежности и прозрачности, например, в финансовой отчетности или научных исследованиях, где необходимо подтвердить достоверность полученных результатов.

Исследования показали, что разработанная система SQuARE демонстрирует высокую точность при работе с табличными данными. В частности, при анализе простых электронных таблиц достигается показатель в 93.3%, а для более сложных, относящихся к категории “Hard”, точность составляет 87%. При этом, система обеспечивает высокий уровень извлечения релевантной информации — показатель Retrieval Recall (R@k) остается на уровне не менее 0.86 при анализе комплексных таблиц, используя только три наиболее релевантных фрагмента данных. Эти результаты свидетельствуют о значительном улучшении возможностей по точному и надежному извлечению информации из табличных источников.

На диаграмме показан бюджет вычислительных ресурсов, выделяемый для обработки каждого запроса к большой языковой модели.

Представленный фреймворк SQuARE, стремясь к адаптивной маршрутизации запросов к табличным данным, неизбежно сталкивается с проблемой взаимосвязанности компонентов. Сложность листов, определяющая выбор между извлечением фрагментов и SQL-запросами, лишь иллюстрирует фундаментальный принцип: разделение системы не устраняет общую судьбу. Как заметил Дональд Дэвис: «Всё связанное когда-нибудь упадёт синхронно». Фреймворк, стремясь к точности и верифицируемости ответов на уровне ячеек, должен учитывать, что даже наиболее продуманная архитектура не избавляет от вероятности каскадных сбоев, вызванных зависимостями между компонентами. Адаптация к сложности — лишь временная мера, поскольку система, даже декомпозированная на микросервисы, остается единым организмом.

Куда Ведет Дорога?

Система SQuARE, стремясь примирить неструктурированный поиск с жесткой логикой SQL, неизбежно наталкивается на фундаментальную истину: любая структура — это временное затишье в хаосе. Метрика сложности листа, как и любая попытка количественно оценить неопределённость, лишь откладывает неминуемый момент, когда таблица данных восстанет против заданных ей границ. Гарантии точности — это договор с вероятностью, а не абсолютная истина.

В дальнейшем, представляется неизбежным отход от бинарного выбора между извлечением фрагментов и SQL-запросами. Следующим шагом видится создание гибридных моделей, способных динамически смешивать оба подхода, учитывая не только сложность листа, но и контекст запроса, а также степень доверия к извлечённым данным. Стабильность — это просто иллюзия, которая хорошо кэшируется; реальная задача — не подавить ошибки, а научиться извлекать из них пользу.

По сути, SQuARE — это не инструмент, а экосистема. Её развитие будет определяться не архитектурными решениями, а способностью адаптироваться к непредсказуемости данных. Попытки построить идеальную систему поиска — наивны. Задача заключается в выращивании системы, способной процветать в условиях постоянного изменения и неопределённости.

Оригинал статьи: https://arxiv.org/pdf/2512.04292.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-07 07:22

🚀 Квантовые новости