Языковые модели диффузии: новый уровень эффективности

Исследование показывает, что модели диффузии превосходят традиционные авторегрессионные модели при ограниченном объеме данных.

Исследование показывает, что модели диффузии превосходят традиционные авторегрессионные модели при ограниченном объеме данных.

Новая архитектура Orion-MSP позволяет эффективно извлекать знания из табличных данных без необходимости в длительном обучении.

Исследователи представляют сложный набор задач для оценки способности мультимодальных моделей понимать и рассуждать о визуальной информации.

Представлена онлайн-платформа RoboChallenge, позволяющая оценить способность роботов понимать язык и выполнять действия в реальном мире.

Новое исследование показывает, что при столкновении визуальной и текстовой информации, выбор модели определяется относительной неуверенностью в каждой из этих модальностей.

Исследование выявило неожиданный пробел в способностях современных языковых моделей к эффективному сотрудничеству.

Бенчмарк VCode демонстрирует, как сложные визуальные представления, такие как SVG, ставят под сомнение возможности современных языковых моделей в области мультимодального кодирования.

Новая модель искусственного интеллекта, обученная на древних текстах аюрведы, открывает возможности для анализа и понимания традиционных медицинских знаний.

Исследование представляет RiddleBench – комплексный тест, оценивающий способность больших языковых моделей к многоступенчатым рассуждениям, пространственному мышлению и коррекции ошибок.
Новый бенчмарк позволяет оценить, насколько эффективно большие мультимодальные модели ‘упаковывают’ визуальную информацию.