Головоломки для машин: как языковые модели решают орфографические задачи

Калибровка сложности решаемых задач для моделей искусственного интеллекта показывает, что разница в производительности между простыми и сложными головоломками значительно варьируется в зависимости от вычислительной мощности модели - для Qwen-4B этот показатель составляет 19-кратное отличие, в то время как для GPT-5-mini - всего 2,5-кратное, при этом корреляция между калибровкой и фактической сложностью задач остается умеренной (r=0.24-0.38), с лучшими показателями у проприетарных моделей.

Новое исследование показывает, как крупные языковые модели справляются с ограничениями, связанными с орфографией, при решении словесных головоломок.

3D-модели на службе у края: сжатие интеллекта для мобильных устройств

Новый подход позволяет переносить мощные трехмерные модели искусственного интеллекта на устройства с ограниченными ресурсами, открывая возможности для применения в реальном времени.

По следу опасных рассуждений: новый подход к оценке безопасности мультимодальных моделей

Анализ и суждение, представленные GuardTrace-VL, демонстрируют способность системы к выделению ключевых аспектов и формированию обоснованных выводов.

Исследователи разработали метод и инструмент для выявления потенциально небезопасных этапов в процессе рассуждений мультимодальных моделей, а не только оценки конечного результата.

Отражения культуры: Как языковые модели рассказывают истории

Исследование выявило категории культурной дезинформации посредством фокус-групп и опросов, что позволило создать таксономию TALES-Tax, а последующее масштабное аннотирование данных обеспечило количественную оценку частоты этих искажений и построение TALES-QA - набора данных для оценки культурной осведомленности языковых моделей.

Новое исследование анализирует, насколько точно и беспристрастно большие языковые модели воспроизводят культурные особенности в сгенерированных повествованиях.

Восстановление формы объекта по рассеянным волнам: новый подход с использованием нейросетей

Электромагнитное рассеяние исследуется на примере двусвязного магнитодиэлектрического цилиндра, демонстрируя трёхмерную структуру и поперечное сечение для анализа распределения поля.

В статье представлен инновационный метод реконструкции формы и свойств электромагнитных препятствий по данным рассеянного поля, основанный на глубоком обучении.

Визуальный интеллект без потерь: новая эра мультимодальных моделей

Модели ViT-UHD и LLaVA-UHD v3 демонстрируют превосходный баланс между эффективностью и производительностью: ViT-UHD превосходит современные визуальные энкодеры по средним показателям на шести эталонных тестах, включая MMBench и AI2D, при этом снижая задержку на 2,4 раза по сравнению с MoonViT, а LLaVA-UHD v3 достигает сопоставимой производительности с передовыми многомодальными моделями, такими как Qwen2-VL, на пятнадцати разнообразных тестах, обеспечивая при этом 1,9-кратное повышение эффективности.

Исследователи представили LLaVA-UHD v3 — модель, способную эффективно обрабатывать изображения в полном разрешении, открывая новые возможности для взаимодействия человека и машины.

Специалисты в команде: новый подход к анализу данных дистанционного зондирования

Архитектура EoS-FM адаптирует входные данные к различным форматам посредством дублирования и отбора каналов, извлекая максимальное количество карт признаков, после чего подмножество из $k$ кодировщиков, производящих по $n$ карт признаков, объединяется в $n$ объединенных карт, которые затем передаются декодеру.

Исследователи предлагают модульную архитектуру, объединяющую специализированные модели для эффективного извлечения признаков из изображений дистанционного зондирования.

Иерархии знаний под контролем ИИ: новый подход к точности представлений

Подход к реструктуризации иерархий, управляемый языковой моделью на основе запросов, позволяет динамически адаптировать структуру данных, используя возможности $LLM$ для оптимизации и повышения эффективности.

Исследователи показали, что использование больших языковых моделей для оптимизации структуры иерархий знаний значительно повышает качество гиперболических векторных представлений.

Восстановление и Разложение: Новое Применение Генеративных Моделей

В рамках исследования предложен новый подход к разложению изображения, использующий контекст «изображение-маска», отличающийся от стандартного, применяемого в диффузионных моделях восстановления, и представленный в виде набора $c^{f}\_{I-M}, c^{b}\_{I-M}$, что позволяет более эффективно декомпозировать изображение.

Исследователи предлагают эффективный метод разложения изображений на слои, основанный на переиспользовании моделей, изначально предназначенных для восстановления поврежденных участков.