Всевидящее око и нейросети: готовы ли мультимодальные модели к задачам видеонаблюдения?

В предлагаемой системе обнаружения аномалий в видеопотоке, необработанные видеоданные преобразуются в сегментированные фрагменты, которые затем анализируются мультимодальными моделями с использованием различных запросов, что позволяет получить классификацию, непосредственно сопоставимую с эталонными данными на уровне всего видео.

Новое исследование проверяет возможности современных искусственных интеллектов в обнаружении аномалий на видео, выявляя ограничения и необходимые условия для их эффективного применения в системах безопасности.

Скрытые риски больших моделей: неустойчивость вычислений

Динамика обучения четырех мультимодальных моделей - LLaVA-v1.5-7B, Idefics3-8B, SmolVLM2-2.2B-Instruct и Janus-Pro-1B - на наборе данных Numerical-COCO демонстрирует, что оптимизация с использованием контролируемой прокси-потери на MSCOCO коррелирует с накопленной метрикой численной разности, вычисляемой на основе отклонений прямого прохода от эталонного высокоточного решения.

Новое исследование показывает, что большие мультимодальные модели могут быть подвержены неожиданным сбоям из-за незначительных изменений входных данных, что приводит к серьезной деградации производительности.

Память как основа бытия: Архитектура цифровой личности

В статье предлагается новый взгляд на организацию памяти в искусственном интеллекте, рассматривающий ее не как функциональный блок, а как онтологическую основу самосознания и непрерывности цифрового существа.

Защита от вредоносных действий: обнаружение аномалий в интерфейсах управления ИИ

Новая система AegisUI позволяет выявлять злонамеренные команды, отправляемые агентами искусственного интеллекта через структурированные протоколы интерфейса пользователя.

Умная маршрутизация запросов к языковым моделям: новый подход

В статье представлен vLLM Semantic Router — система, обеспечивающая интеллектуальную маршрутизацию запросов между различными языковыми моделями и провайдерами для оптимизации затрат, безопасности и производительности.

Генераторы задач ARC-TGI: Проверка интеллекта машин на прочность

Задача ARC-AGI (идентификатор: 103eff5b) и соответствующий пример ARC-TGI демонстрируют способность системы к решению задач, требующих логического вывода и применения знаний, что подтверждает её потенциал в области искусственного общего интеллекта.

Новый подход к оценке способностей искусственного интеллекта позволяет создавать динамические наборы задач, требующих последовательного рассуждения и проверки человеком.

Искусственный интеллект на службе правосудия: поиск расовой предвзятости в судебных решениях

Анализ, представленный на платформе redoio.info, позволяет оценить силу связи между демографическими характеристиками и исходами вынесения приговоров, например, в случаях применения принципа

Новое исследование оценивает возможности использования ИИ для выявления и представления статистических доказательств расовой предвзятости в уголовном судопроизводстве, особенно в контексте Закона о расовой справедливости штата Калифорния.

Что думают люди: Новый взгляд на оценку языковых моделей

Разнородность предпочтений пользователей проявляется в расхождениях между группами, измеряемых как средняя разница в рангах, и в степени их нерешительности, отражаемой частотой возникновения ничьих в зависимости от возраста.

Исследование предлагает более точный и учитывающий различия между группами пользователей подход к оценке качества больших языковых моделей, выходящий за рамки автоматических тестов.