Всевидящее око и нейросети: готовы ли мультимодальные модели к задачам видеонаблюдения?

В предлагаемой системе обнаружения аномалий в видеопотоке, необработанные видеоданные преобразуются в сегментированные фрагменты, которые затем анализируются мультимодальными моделями с использованием различных запросов, что позволяет получить классификацию, непосредственно сопоставимую с эталонными данными на уровне всего видео.

Новое исследование проверяет возможности современных искусственных интеллектов в обнаружении аномалий на видео, выявляя ограничения и необходимые условия для их эффективного применения в системах безопасности.

Квантовый скачок: О будущем химии и ИИ

Квантовый скачок: О будущем химии и ИИ Забавно, как мы всегда ищем способы ускорить процессы, обмануть природу. Но что, если ключ к ускорению лежит не в грубой силе, а в тонком понимании её правил? Вот и ученые предлагают использовать квантовые компьютеры для обучения искусственного интеллекта, чтобы тот моделировал химические системы. Это как дать ИИ возможность … Читать далее

Скрытые риски больших моделей: неустойчивость вычислений

Динамика обучения четырех мультимодальных моделей - LLaVA-v1.5-7B, Idefics3-8B, SmolVLM2-2.2B-Instruct и Janus-Pro-1B - на наборе данных Numerical-COCO демонстрирует, что оптимизация с использованием контролируемой прокси-потери на MSCOCO коррелирует с накопленной метрикой численной разности, вычисляемой на основе отклонений прямого прохода от эталонного высокоточного решения.

Новое исследование показывает, что большие мультимодальные модели могут быть подвержены неожиданным сбоям из-за незначительных изменений входных данных, что приводит к серьезной деградации производительности.

Память как основа бытия: Архитектура цифровой личности

В статье предлагается новый взгляд на организацию памяти в искусственном интеллекте, рассматривающий ее не как функциональный блок, а как онтологическую основу самосознания и непрерывности цифрового существа.

Поиск без границ: модульная платформа для интеллектуального поиска

Ключевые состояния хранимых данных SearchGym демонстрируют, как система организует и поддерживает информацию для эффективного поиска, обеспечивая основу для адаптации и оптимизации стратегий исследования.

Новая инфраструктура SearchGym позволяет создавать и оценивать гибридные системы поиска, объединяя различные подходы для достижения оптимального результата.

Защита от вредоносных действий: обнаружение аномалий в интерфейсах управления ИИ

Новая система AegisUI позволяет выявлять злонамеренные команды, отправляемые агентами искусственного интеллекта через структурированные протоколы интерфейса пользователя.

Умная маршрутизация запросов к языковым моделям: новый подход

В статье представлен vLLM Semantic Router — система, обеспечивающая интеллектуальную маршрутизацию запросов между различными языковыми моделями и провайдерами для оптимизации затрат, безопасности и производительности.

Сжатие признаков нейросетей: новый подход к экономии ресурсов

Мягкая квантизация ([latex]Q^s[/latex]) и побитовая мягкая квантизация ([latex]Q^{bw,s}[latex]) формируются посредством суммирования или конкатенации нескольких мягких ступенчатых функций, что обеспечивает их дифференцируемость по отношению к порогам и, следовательно, возможность оптимизации в процессе обучения, после чего, на этапе инференса, происходит преобразование в жёсткую квантизацию ([latex]Q[/latex]) и побитовую квантизацию ([latex]Q^{bw}[/latex]) посредством округления.

Исследователи предлагают инновационный метод сжатия входных данных для нейронных сетей, позволяющий значительно снизить энергопотребление и вычислительные затраты.