Всевидящее око и нейросети: готовы ли мультимодальные модели к задачам видеонаблюдения?

Новое исследование проверяет возможности современных искусственных интеллектов в обнаружении аномалий на видео, выявляя ограничения и необходимые условия для их эффективного применения в системах безопасности.




![Мягкая квантизация ([latex]Q^s[/latex]) и побитовая мягкая квантизация ([latex]Q^{bw,s}[latex]) формируются посредством суммирования или конкатенации нескольких мягких ступенчатых функций, что обеспечивает их дифференцируемость по отношению к порогам и, следовательно, возможность оптимизации в процессе обучения, после чего, на этапе инференса, происходит преобразование в жёсткую квантизацию ([latex]Q[/latex]) и побитовую квантизацию ([latex]Q^{bw}[/latex]) посредством округления.](https://arxiv.org/html/2603.05172v1/2603.05172v1/x3.png)