Видеопоиск без границ: новый подход к универсальному пониманию видео

Исследователи предлагают новый метод обучения моделей, позволяющий им эффективно искать видео по различным запросам и в разных областях.

Исследователи предлагают новый метод обучения моделей, позволяющий им эффективно искать видео по различным запросам и в разных областях.

Новый бенчмарк NaviTrace позволяет оценить способность моделей, сочетающих зрение и язык, к планированию маршрутов и пониманию окружающего пространства.

Превращение замороженных моделей, понимающих и видео, и текст, в эффективные системы ранжирования без дополнительного обучения.

Исследование выявляет пробелы в способности современных моделей понимать и комбинировать информацию из разных источников, таких как текст и изображения.

Исследователи предлагают способ улучшить качество рассуждений искусственного интеллекта, фокусируясь не на ответах, а на самом процессе мышления.

Новый бенчмарк MeasureBench проверяет, насколько хорошо ИИ понимает показания измерительных приборов.

Исследователи предлагают инновационный подход к эффективному распределению вычислительных ресурсов при масштабировании больших языковых моделей в реальном времени.
Представлен новый датасет и методика оценки способности моделей искусственного интеллекта понимать и решать визуальные загадки.

Исследователи представили комплексный бенчмарк для оценки способности моделей с искусственным интеллектом активно рассуждать с использованием изображений.

Новая модель объединяет возможности понимания изображений, обработки языка и прогнозирования действий для более эффективного управления роботами.