Визуальный интеллект машин: новый тест на сообразительность

Исследователи представляют сложный набор задач для оценки способности мультимодальных моделей понимать и рассуждать о визуальной информации.

Исследователи представляют сложный набор задач для оценки способности мультимодальных моделей понимать и рассуждать о визуальной информации.

Представлена онлайн-платформа RoboChallenge, позволяющая оценить способность роботов понимать язык и выполнять действия в реальном мире.

Новое исследование показывает, что при столкновении визуальной и текстовой информации, выбор модели определяется относительной неуверенностью в каждой из этих модальностей.

Исследование выявило неожиданный пробел в способностях современных языковых моделей к эффективному сотрудничеству.

Бенчмарк VCode демонстрирует, как сложные визуальные представления, такие как SVG, ставят под сомнение возможности современных языковых моделей в области мультимодального кодирования.

Новая модель искусственного интеллекта, обученная на древних текстах аюрведы, открывает возможности для анализа и понимания традиционных медицинских знаний.

Исследование представляет RiddleBench – комплексный тест, оценивающий способность больших языковых моделей к многоступенчатым рассуждениям, пространственному мышлению и коррекции ошибок.
Новый бенчмарк позволяет оценить, насколько эффективно большие мультимодальные модели ‘упаковывают’ визуальную информацию.

Исследование посвящено проблеме сохранения визуального понимания в моделях, объединяющих зрение, язык и действия, при адаптации к новым задачам робототехники.
Квантовый горизонт: Бразилия и будущее квантовых технологий Знаете, как в квантовой механике частица может находиться во множестве состояний одновременно? Вот и с новостями о квантовых технологиях так: кажется, что всё происходит сразу, но разобраться в этом непросто. Особенно когда речь идет о формировании квантовых экосистем в разных странах. Бразилия, судя по последним сообщениям, делает весьма … Читать далее