Искусственный интеллект против аналитика: кто точнее?

Автор: Денис Аветисян


Новое исследование показывает, что современные системы искусственного интеллекта пока уступают экспертам-аналитикам в точности прогнозов.

Оценка ущерба в страховании недвижимости демонстрирует значительный разрыв в эффективности: использование экспертами-аналитиками данных доменных знаний, таких как оценка состояния крыши по изображениям, позволяет достичь существенно более высокой точности прогнозирования убытков (нормализованный индекс Джини = 0.8310), в то время как агентственный искусственный интеллект, ограничивающийся стандартным табличным моделированием и игнорирующий визуальную информацию и специфику предметной области, показывает значительно худшие результаты (нормализованный индекс Джини = 0.3823).
Оценка ущерба в страховании недвижимости демонстрирует значительный разрыв в эффективности: использование экспертами-аналитиками данных доменных знаний, таких как оценка состояния крыши по изображениям, позволяет достичь существенно более высокой точности прогнозирования убытков (нормализованный индекс Джини = 0.8310), в то время как агентственный искусственный интеллект, ограничивающийся стандартным табличным моделированием и игнорирующий визуальную информацию и специфику предметной области, показывает значительно худшие результаты (нормализованный индекс Джини = 0.3823).

Анализ показывает, что системы на основе больших языковых моделей отстают от человека при работе с данными, требующими экспертных знаний в области визуальной информации, при оценке по метрике Normalized Gini.

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу

Несмотря на значительные успехи в автоматизации рабочих процессов анализа данных, остается открытым вопрос о способности автономных систем на базе больших языковых моделей (LLM) конкурировать с экспертами-аналитиками. В статье «Can Agentic AI Match the Performance of Human Data Scientists?» исследуется эта проблема, демонстрируя, что текущие агентные ИИ, ориентированные на обработку табличных данных, уступают специалистам, способным извлекать скрытые закономерности из визуальной информации. Эксперименты на синтетическом наборе данных для страхования недвижимости показали, что использование предметных знаний критически важно для повышения точности прогнозов. Смогут ли будущие разработки агентного ИИ преодолеть это ограничение и эффективно интегрировать специфические знания в процесс анализа данных?


Точность прогноза убытков: краеугольный камень эффективного управления рисками

Точное прогнозирование убытков имеет первостепенное значение для эффективного управления рисками в сфере имущественного страхования. От способности страховщиков корректно оценивать потенциальные выплаты напрямую зависит их финансовая устойчивость и способность предлагать конкурентоспособные тарифы. Неточные прогнозы могут приводить к недооценке рисков, что грозит убыточностью, или к переоценке, что ведет к потере клиентов. Эффективное прогнозирование позволяет не только оптимизировать резервы под выплаты, но и более точно определять стоимость страховых полисов, учитывая индивидуальные характеристики каждого объекта и его подверженность различным рискам, таким как стихийные бедствия, пожары или кражи. Таким образом, точное предсказание убытков является краеугольным камнем стабильности и прибыльности страховых компаний.

Традиционные актуарные методы, несмотря на свою устоявшуюся практику, всё чаще сталкиваются с трудностями при оценке рисков в современной страховой индустрии. Сложность заключается в растущем объеме и разнообразии факторов, влияющих на потенциальные убытки. Ранее преобладавшие статистические модели зачастую не способны эффективно учитывать новые типы рисков, такие как киберугрозы или климатические изменения, а также быстро меняющиеся социально-экономические условия. Ограниченность доступных данных, их фрагментарность и неполнота, в свою очередь, снижают точность прогнозов и затрудняют адекватную оценку вероятности наступления страховых случаев. В результате, актуарные расчёты могут оказаться недостаточно точными для эффективного управления рисками и обеспечения финансовой устойчивости страховых компаний.

Процесс генерации данных для страхования недвижимости включает в себя определение скрытой переменной 'Состояние крыши' на основе структурированных характеристик полиса и визуальное кодирование этой переменной в изображении крыши, что требует ее последующего вывода для точного прогнозирования страховых выплат.
Процесс генерации данных для страхования недвижимости включает в себя определение скрытой переменной ‘Состояние крыши’ на основе структурированных характеристик полиса и визуальное кодирование этой переменной в изображении крыши, что требует ее последующего вывода для точного прогнозирования страховых выплат.

Автоматизация прогнозирования убытков с помощью автономных ИИ-агентов

Агентивные системы искусственного интеллекта, основанные на больших языковых моделях (LLM), представляют собой перспективный подход к автоматизации сложных рабочих процессов в области науки о данных. В отличие от традиционных методов, требующих ручного вмешательства на каждом этапе — от подготовки данных до построения и развертывания модели — агентивные системы способны самостоятельно выполнять последовательность действий для решения поставленной задачи. Это включает в себя автоматический анализ данных, выбор подходящих алгоритмов, обучение моделей и оценку их эффективности, значительно сокращая время и ресурсы, необходимые для получения результатов. Возможность автоматизации рутинных операций позволяет специалистам сосредоточиться на более сложных аспектах анализа и интерпретации данных.

Агентивные системы искусственного интеллекта, использующие большие языковые модели (LLM), способны принимать и обрабатывать разнородные типы данных для формирования прогнозов убытков. К таким типам данных относятся как структурированные табличные данные, включающие числовые и категориальные признаки, так и неструктурированные данные изображений. Обработка изображений позволяет системе извлекать визуальную информацию, релевантную для оценки рисков и прогнозирования потенциальных убытков, дополняя аналитические возможности, основанные исключительно на табличных данных. Совместное использование различных типов данных повышает точность и надежность прогнозов, позволяя учитывать более широкий спектр факторов, влияющих на вероятность возникновения убытков.

При использовании исключительно табличных данных, системы на базе Agentic AI демонстрируют нормализованный коэффициент Джини (Normalized Gini) в размере 0.3823. Этот показатель указывает на ограниченную эффективность подходов, основанных исключительно на анализе структурированных данных, в задачах прогнозирования убытков. Низкое значение коэффициента Джини свидетельствует о недостаточной способности модели к различению между клиентами с высоким и низким риском, что ограничивает её практическую применимость в сценариях оценки кредитоспособности или страхования. Необходимость интеграции дополнительных источников данных, таких как изображения, является ключевым фактором для повышения точности и эффективности моделей Agentic AI в данной области.

Для синтетического набора данных страхования недвижимости были сгенерированы изображения крыш, отражающие состояние RoofHealth (отличное, удовлетворительное, плохое) и позволяющие сравнивать эффективность алгоритмов, использующих только табличные данные, с подходами, способными анализировать и визуальную информацию.
Для синтетического набора данных страхования недвижимости были сгенерированы изображения крыш, отражающие состояние RoofHealth (отличное, удовлетворительное, плохое) и позволяющие сравнивать эффективность алгоритмов, использующих только табличные данные, с подходами, способными анализировать и визуальную информацию.

Визуальные данные: расширение точности прогнозирования

Визуальные данные, включающие аэрофотоснимки и фотографии, сделанные непосредственно на объекте, предоставляют ценную информацию о состоянии недвижимости и потенциальных рисках. Анализ изображений позволяет выявлять такие факторы, как повреждения крыши, состояние фасада, наличие растительности, представляющей угрозу, и признаки потенциальных структурных проблем. Эти данные, в отличие от текстовых описаний, дают объективную картину состояния объекта и позволяют более точно оценивать риски, связанные с его эксплуатацией и страхованием. Использование визуальной информации значительно повышает надежность оценки и снижает вероятность ошибок, связанных с субъективным восприятием.

Для извлечения признаков и получения информации из визуальных данных, таких как аэрофотоснимки и фотографии объектов, используются модели машинного зрения, включая CLIP (Contrastive Language-Image Pre-training) и Vision-Language модели, например, gpt-4o-mini. CLIP осуществляет сопоставление изображений и текста, формируя векторные представления (embeddings), отражающие семантическое содержание визуальных данных. Vision-Language модели, в свою очередь, позволяют не только анализировать изображения, но и соотносить их с текстовыми описаниями, обеспечивая более глубокое понимание и контекстуализацию визуальной информации. Эти модели позволяют автоматизировать процесс анализа, выявлять закономерности и получать ценные данные о состоянии объектов и потенциальных рисках.

Использование CLIP-вложений позволило повысить значение Нормализованного коэффициента Джини до 0.5042, в то время как применение полных CLIP-признаков достигло показателя 0.7719. Данные результаты демонстрируют существенное влияние визуальной информации на повышение точности предсказаний. Увеличение Нормализованного коэффициента Джини указывает на улучшение способности модели к различению между классами и более точную оценку рисков, что подтверждает эффективность интеграции визуальных данных в процесс анализа.

Проверка производительности с использованием синтетических данных

Синтетические данные, генерируемые с контролируемыми параметрами, такими как состояние кровли (Roof Health), обеспечивают надежную платформу для оценки прогностических моделей. В отличие от использования реальных данных, которые могут содержать шум и необъяснимые факторы, синтетические данные позволяют изолированно тестировать влияние конкретных переменных на точность прогнозирования убытков. Это достигается путем создания наборов данных, в которых состояние кровли варьируется в заданном диапазоне, что позволяет оценить, как изменения этого параметра влияют на производительность модели и выявить области для ее улучшения. Контролируемый характер синтетических данных гарантирует воспроизводимость результатов и позволяет проводить всесторонний анализ чувствительности модели к различным факторам.

Использование синтетических данных позволяет целенаправленно изменять отдельные факторы, такие как состояние кровли, и оценивать их влияние на точность прогнозирования убытков. Такой подход дает возможность изолировать влияние каждого параметра, выявляя наиболее значимые факторы, определяющие эффективность модели. Анализ результатов позволяет точно определить области, требующие улучшения в алгоритмах прогнозирования, и оптимизировать их для повышения общей производительности. Например, можно определить, насколько критично точное определение состояния кровли для снижения погрешности прогноза убытков, и сосредоточить усилия на совершенствовании алгоритмов оценки этого параметра.

Оценка состояния кровли, выполненная специалистами по данным с использованием модели gpt-4o-mini, демонстрирует нормализованный коэффициент Джини на уровне 0.7271. При использовании идеально точных меток состояния кровли, этот показатель возрастает до 0.8310, приближаясь к производительности «оракула» — 0.8379. Данные результаты свидетельствуют о высокой степени точности модели gpt-4o-mini в оценке состояния кровли и указывают на потенциал для дальнейшего улучшения производительности при наличии более точных данных для обучения.

Роль экспертных оценок и перспективы на будущее

Несмотря на автоматизацию ключевых этапов с помощью автономных ИИ-систем, роль специалистов по данным остаётся критически важной. Они обеспечивают проверку результатов анализа, что необходимо для выявления потенциальных ошибок и обеспечения надёжности оценок. Особенно ценным является внедрение экспертных знаний в области страхования, позволяющее учитывать специфические факторы риска, которые алгоритмы могут упустить. В сложных, нестандартных случаях, требующих глубокого понимания контекста и принятия взвешенных решений, именно опытные аналитики обеспечивают точность и адекватность оценки рисков, что в конечном итоге повышает эффективность и устойчивость страховых практик.

Сочетание автоматизированного анализа и экспертной оценки человека открывает новые горизонты в оценке рисков для страхования имущества. Автоматизация позволяет обрабатывать огромные объемы данных и выявлять закономерности, которые могли бы остаться незамеченными, однако, именно опытные специалисты способны интерпретировать результаты, учитывать нюансы конкретных объектов и регионов, а также применять знания о специфических факторах риска. Такой симбиоз позволяет значительно повысить точность оценки, минимизировать ошибки и, как следствие, оптимизировать страховые выплаты и улучшить финансовую устойчивость страховых компаний. В конечном итоге, подобный подход позволяет создать более эффективную и надежную систему оценки рисков, способную адаптироваться к изменяющимся условиям и новым вызовам.

Взаимодействие искусственного интеллекта и опыта специалистов открывает новые горизонты в моделировании рисков и повышает устойчивость страховых практик. Автоматизированный анализ, осуществляемый ИИ, позволяет обрабатывать огромные объемы данных и выявлять закономерности, которые могут быть упущены при традиционных методах оценки. Однако, для интерпретации сложных случаев, требующих учета специфических знаний о конкретном регионе или типе имущества, а также для проверки адекватности результатов, необходимы экспертные оценки. Сочетание этих двух подходов позволяет создавать более точные и надежные модели, способные предвидеть потенциальные убытки и эффективно управлять рисками, что, в конечном итоге, способствует формированию более устойчивой и предсказуемой страховой системы.

Исследование демонстрирует, что современные системы искусственного интеллекта, действующие как агенты, уступают человеку-аналитику данных в задачах прогнозирования. Это связано с тем, что агенты, полагающиеся на генерацию кода из табличных данных, не способны эффективно использовать знания, заложенные в визуальной информации. Как говорил Алан Тьюринг: «Прежде чем пытаться строить умные машины, нужно понять, как работает человеческий разум». Данное утверждение особенно актуально в контексте работы с изображениями, где интуитивное понимание, свойственное человеку, позволяет выявить закономерности, недоступные алгоритмам, оперирующим лишь структурированными данными. Недостаток способности к интеграции знаний из различных модальностей данных и является ключевым ограничением современных агентских систем.

Куда же дальше?

Представленная работа выявила закономерную, хотя и неудобную истину: автоматизированные системы, полагающиеся исключительно на обработку табличных данных, уступают человеческому аналитику, способному интегрировать знания, закодированные в визуальной информации. Элегантность алгоритма не компенсирует отсутствие понимания контекста. Попытки создать универсального решателя задач, игнорируя специфику предметной области, обречены на ограниченный успех.

Необходимость преодоления этого разрыва требует смещения акцента с генерации кода как самоцели на разработку систем, способных к осмысленному извлечению и применению знаний из различных модальностей данных. Простое увеличение объема обучающих данных или мощности вычислительных ресурсов не является решением. Важнее — разработка механизмов, позволяющих агенту формировать внутреннюю модель предметной области, а не просто оперировать статистическими закономерностями.

Будущие исследования должны сосредоточиться на создании гибридных систем, сочетающих сильные стороны автоматизированных агентов и экспертных знаний. Возможно, истинная ценность искусственного интеллекта заключается не в замене человека, а в усилении его способностей. И тогда, возможно, сложность алгоритмов уступит место простоте понимания.


Оригинал статьи: https://arxiv.org/pdf/2512.20959.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-25 07:58