Ребусы для ИИ: новый масштабный тест на сообразительность
Представлен новый датасет и методика оценки способности моделей искусственного интеллекта понимать и решать визуальные загадки.
Представлен новый датасет и методика оценки способности моделей искусственного интеллекта понимать и решать визуальные загадки.

Исследователи представили комплексный бенчмарк для оценки способности моделей с искусственным интеллектом активно рассуждать с использованием изображений.

Новая модель объединяет возможности понимания изображений, обработки языка и прогнозирования действий для более эффективного управления роботами.

Как новая архитектура позволяет большим языковым моделям понимать визуальный мир, планировать сложные действия и эффективно использовать инструменты для достижения целей.
Как новые модели, основанные на генерации видео и обучении с подкреплением, создают высокоточные и управляемые симуляции для развития искусственного интеллекта, способного взаимодействовать с физическим миром.

Исследование показывает, что понимание того, как большие языковые модели интегрируют внутренние и внешние знания, требует анализа более сложного взаимодействия, чем простое включение/выключение.

Как применение моделей компьютерного зрения к представлениям графов позволяет лучше понимать глобальную структуру и масштабируемость графов, приближаясь к человеческому восприятию.

Как новая модель позволяет создавать интеллектуальные системы, способные понимать и реагировать на мультимедийный контент в режиме реального времени.
Как новая архитектура с разреженной активацией и оптимизированное обучение позволяют создавать языковые модели с триллионом параметров, сочетающие высокую точность рассуждений и эффективность вычислений.

Новый фреймворк UME-R1 объединяет генеративные и дискриминативные подходы к мультимодальным эмбеддингам, используя обучение с подкреплением для улучшения рассуждений и повышения производительности.