Как мозг вращает кубики: новая модель качественного рассуждения о вращениях

Исследователи разработали модель, позволяющую понять, как люди мысленно манипулируют объектами в пространстве, и применили ее для решения сложной задачи сравнения кубиков.

Путь к пониманию: Робот-навигатор с памятью и адаптивным мышлением

Модель VLingNav, использующая адаптивное рассуждение на основе цепочки мыслей (CoT) и визуально-лингвистическую память, демонстрирует передовые результаты в задачах воплощенной навигации и способна к выполнению сложных навигационных задач в реальном мире без предварительного обучения.

Новая модель VLingNav позволяет роботам ориентироваться в сложных пространствах, используя визуальные подсказки, лингвистическую память и способность к адаптивному планированию.

Искусственный интеллект в образовании: навыки будущего

В статье рассматривается вопрос подготовки педагогов к эффективному и осознанному использованию инструментов искусственного интеллекта в учебном процессе.

Текст в Изображение: Новый Подход к Визуальному Редактированию

Предложенная схема UM-Text обеспечивает многоязычную генерацию и редактирование визуального текста, используя интегрированный мультимодальный кодировщик и маски, полученные из предсказанной разметки UM-Designer, что позволяет одной модели поддерживать широкий спектр задач, определяемых инструкциями.

Исследователи представили UM-Text — модель, объединяющую возможности понимания изображений и обработки текста для точного и гибкого редактирования визуального контента по текстовым запросам.

Раскрывая скрытые мотивы: как научить ИИ понимать чужие намерения

В рамках исследования взаимодействия многоагентных больших языковых моделей выявляется пробел в традиционных методах оценки логического вывода, связанный с необходимостью вывода скрытых намерений, выходящих за рамки поверхностных утверждений; для решения этой задачи предложен метод атрибутивной логической оценки (Att-NLI) - двухэтапная абдуктивно-дедуктивная система, основанная на теории атрибуции и включающая выбор намерения с последующей проверкой вывода, реализованная посредством верифицируемой социальной дедуктивной игры Undercover-V, позволяющей эмпирически тестировать атрибуцию скрытых намерений.

Новое исследование предлагает метод оценки способности языковых моделей к выявлению намерений других агентов в сложных социальных взаимодействиях.

Визуальный поиск и генерация: новый эталон для сложных задач

Набор данных ViDoRe V3 демонстрирует сложность реальных сценариев поиска информации, охватывая разнообразные типы запросов и визуально насыщенные форматы документов из различных областей.

Исследователи представили ViDoRe V3 — комплексную платформу для оценки систем, объединяющих поиск информации и генерацию текста на основе визуальных документов.

Восстановление по выборке: искусство приближения функций

В статье рассматриваются современные методы восстановления функций на основе дискретных выборок, стремящиеся к достижению точности, сравнимой с оптимальными аппроксимациями.

Искусственный интеллект и экспертные решения: как меняется принятие решений в сети

Новое исследование показывает, что при оценке информации в сложных областях, пользователи не делают принципиальной разницы между текстами, созданными искусственным интеллектом, и экспертным контентом, написанным человеком.

Ускорение квантохимических расчётов: новый подход к плотностной аппроксимации

Применение адаптивной точности к вычислениям дискретного преобразования Фурье (ДПФ) демонстрирует ускорение по сравнению со стандартным алгоритмом FP64, при этом все этапы, включая вычисление интегралов [latex](i_j|p)[/latex] и построение тензора [latex]B_{ij}^{q}[/latex], учтены; отсутствие данных в некоторых точках обусловлено нехваткой памяти GPU для проведения соответствующих вычислений.

Исследователи разработали адаптивный алгоритм, использующий 8-битные целочисленные вычисления на AI-ускорителях для значительного повышения скорости вычислений плотностной аппроксимации.