Визуальный анализ документов: новый вызов для искусственного интеллекта

Исследователи представили ExStrucTiny — масштабный набор данных для оценки способности моделей извлекать структурированную информацию из изображений документов.

Исследователи представили ExStrucTiny — масштабный набор данных для оценки способности моделей извлекать структурированную информацию из изображений документов.

В статье представлен разработанный и протестированный технический курс, направленный на повышение AI-грамотности специалистов в области перевода и специализированной коммуникации.
Исследователи представили Sci-CoE — систему, позволяющую большим языковым моделям самостоятельно улучшать свои способности к научному мышлению.
В статье рассматривается переход от традиционных систем защиты к автономным, когнитивным сетям агентов, способным к самообучению и адаптации к меняющимся угрозам.

Новый подход dVoting позволяет повысить качество рассуждений больших языковых моделей, не увеличивая при этом вычислительные затраты.
Новая волна генеративного искусственного интеллекта порождает произведения, которые часто балансируют на грани между творчеством и банальностью, поднимая вопросы о ценности и подлинности в цифровой культуре.
![Благодаря дифференцируемому механизму доверия, надежные агенты ([latex]A_{\theta} \approx 0.94[/latex]) стабильно поддерживают высокий уровень доверия на протяжении 100 циклов коммуникации, в то время как доверие к неисправным агентам ([latex]A_{\theta} \approx 0.08[/latex]) последовательно снижается, что позволяет алгоритму консенсуса на основе MLNN точно отслеживать истинные значения, в отличие от простого усреднения, подверженного систематической предвзятости из-за ошибочных показаний датчиков.](https://arxiv.org/html/2602.12083v1/x8.png)
Исследователи предлагают инновационный подход к отладке, мониторингу и контролю сложных систем, объединяя логические рассуждения с возможностями дифференцируемого программирования.

Новая модель P-GenRM позволяет адаптировать большие языковые модели под индивидуальные предпочтения пользователя, значительно повышая качество генерируемого контента.

Исследователи представляют AM-FM — первую модель, способную «понимать» окружающую среду, используя данные, полученные от WiFi-сигналов.

Ученые представили GigaBrain-0.5M*, систему, позволяющую роботам учиться сложным задачам манипулирования объектами благодаря интеграции визуального восприятия, языка и обучения с подкреплением.