Визуальный компас: ИИ находит местоположение по изображениям

Новая модель GeoVista использует возможности искусственного интеллекта и веб-инструменты для точного определения географического положения объектов на фотографиях.

Новая модель GeoVista использует возможности искусственного интеллекта и веб-инструменты для точного определения географического положения объектов на фотографиях.

Исследователи представили MusicAIR — систему, способную создавать музыку на основе текста и изображений, используя алгоритмы и музыкальную теорию вместо нейронных сетей.

Исследователи представили OpenMMReasoner — рецепт обучения масштабных моделей, способных эффективно обрабатывать информацию из разных источников.

Исследователи представили систему, имитирующую процесс анализа гистологических препаратов, что позволяет автоматизировать и повысить точность диагностики.
Исследователи представили RynnVLA-002 — единую архитектуру, объединяющую зрение, язык и действия, для более эффективного управления роботами.
Новое исследование показывает, как инструменты топологического анализа данных позволяют количественно оценить и различить стили живописи, от авторских манеры до направлений в искусстве.

Новая модель Video-R4 улучшает интерпретацию видеороликов с текстовым сопровождением за счет многократного анализа ключевых кадров и областей изображения.
Обзор анализирует растущее воздействие генеративных моделей ИИ на окружающую среду, уделяя особое внимание энергопотреблению и углеродному следу на всех этапах жизненного цикла.

Новая модель глубокого обучения итеративно анализирует видео, фокусируясь на ключевых кадрах и областях, чтобы повысить точность понимания видеоконтента с текстовыми пояснениями.
Растущая популярность генеративных моделей искусственного интеллекта требует оценки их воздействия на окружающую среду, включая выбросы углерода и потребление ресурсов.