Как мозг вращает кубики: новая модель качественного рассуждения о вращениях
Исследователи разработали модель, позволяющую понять, как люди мысленно манипулируют объектами в пространстве, и применили ее для решения сложной задачи сравнения кубиков.
Исследователи разработали модель, позволяющую понять, как люди мысленно манипулируют объектами в пространстве, и применили ее для решения сложной задачи сравнения кубиков.

Новая модель VLingNav позволяет роботам ориентироваться в сложных пространствах, используя визуальные подсказки, лингвистическую память и способность к адаптивному планированию.
В статье рассматривается вопрос подготовки педагогов к эффективному и осознанному использованию инструментов искусственного интеллекта в учебном процессе.
![Исследование демонстрирует, что внедрение структурированного подхода к поиску, в отличие от неструктурированного ([latex]Search-o1[/latex]), и динамического исследования пространства состояний ([latex]GraphSearch[/latex]) позволяет значительно повысить эффективность обучения на графах по сравнению с методами, использующими статическое внедрение информации о соседях ([latex]GraphICL[/latex]).](https://arxiv.org/html/2601.08621v1/figures/motivation.png)
Новый подход позволяет моделям рассуждать над графовыми данными, извлекая знания даже без предварительного обучения.

Исследователи представили UM-Text — модель, объединяющую возможности понимания изображений и обработки текста для точного и гибкого редактирования визуального контента по текстовым запросам.

Новое исследование предлагает метод оценки способности языковых моделей к выявлению намерений других агентов в сложных социальных взаимодействиях.

Исследователи представили ViDoRe V3 — комплексную платформу для оценки систем, объединяющих поиск информации и генерацию текста на основе визуальных документов.
В статье рассматриваются современные методы восстановления функций на основе дискретных выборок, стремящиеся к достижению точности, сравнимой с оптимальными аппроксимациями.
Новое исследование показывает, что при оценке информации в сложных областях, пользователи не делают принципиальной разницы между текстами, созданными искусственным интеллектом, и экспертным контентом, написанным человеком.
[/latex] и построение тензора [latex]B_{ij}^{q}[/latex], учтены; отсутствие данных в некоторых точках обусловлено нехваткой памяти GPU для проведения соответствующих вычислений.](https://arxiv.org/html/2601.08077v1/x4.png)
Исследователи разработали адаптивный алгоритм, использующий 8-битные целочисленные вычисления на AI-ускорителях для значительного повышения скорости вычислений плотностной аппроксимации.