Всевидящее око и нейросети: готовы ли мультимодальные модели к задачам видеонаблюдения?

Новое исследование проверяет возможности современных искусственных интеллектов в обнаружении аномалий на видео, выявляя ограничения и необходимые условия для их эффективного применения в системах безопасности.



![В ходе решения медицинской задачи MM-1993 в системе MedXpertQA, промежуточный этап логических рассуждений, сохраненный в переменной [latex]ASSISTANT\_RATIONALE[/latex], позволил получить итоговый ответ, демонстрируя способность модели к последовательному анализу и обоснованию принятых решений.](https://arxiv.org/html/2603.04763v1/2603.04763v1/images/MM-1993-a.jpeg)

