Физика в графах: Новый подход к моделированию динамических систем

Исследователи представили PhysGTO — инновационный метод обучения, позволяющий эффективно моделировать физические процессы с использованием графовых нейронных сетей и представлений многообразий.

Визуальное мышление для ИИ: новый подход к пониманию изображений

Система GETok наделяет мультимодальные языковые модели (MLLM) обучаемыми дискретными токенами, привязанными к равномерно распределенным точкам на плоскости изображения, что обеспечивает унифицированное сопоставление различных входных данных, таких как текст, точки, ограничивающие рамки и сегментационные маски, а схема уточнения локализации дополнительно поддерживает корректировку от грубого к точному и итеративное восстановление после первоначальных ошибок сопоставления.

Исследователи предлагают инновационный метод, позволяющий нейросетям лучше ориентироваться в пространстве и понимать визуальную информацию, используя специальные «токены» для описания расположения объектов.

Генерация 3D-миров по запросу: Искусственный интеллект творит без обучения

Предложенная архитектура способна генерировать реалистичные трехмерные карты по текстовому описанию, используя процедурную генерацию контента в режиме, не требующем предварительного обучения.

Новая архитектура позволяет большим языковым моделям создавать сложные трехмерные пространства, используя лишь текстовые описания и встроенную документацию инструментов.

Прогнозирование потока прямой осмоса: новый подход к точности и надежности

Гибридная робастная модель GPR демонстрирует стабильное превосходство над всеми остальными вариантами при оценке точности прогнозирования потока воды через фильтр, подтверждаемое показателями MAE, $R^2$, и MAPE.

В статье представлена инновационная гибридная модель, объединяющая физические принципы и машинное обучение для точного предсказания скорости потока прямой осмоса.

Визуальная навигация: новый подход к эффективному обучению

Модель Efficient-VLN установила новый стандарт в навигации по визуально-языковым ориентирам в непрерывных средах, используя исключительно RGB-входные данные, и достигла 64.2% и 67.0% показателей успешности в бенчмарках R2R и RxR соответственно, потребовав при этом лишь 282 часа работы на GPU H800 - значительно меньше вычислительных ресурсов, чем у конкурирующих методов.

Исследователи представили Efficient-VLN, систему, позволяющую значительно снизить затраты на обучение моделей, способных ориентироваться в пространстве, используя визуальные и языковые подсказки.

Кто пишет науку: гендерные различия в канадских научных журналах

Новое исследование показывает, что женщины по-прежнему недостаточно представлены в качестве авторов научных публикаций в Канаде, но причина кроется не в предвзятости рецензирования, а в общем представлении женщин в STEM-областях.

Искусственный интеллект на службе науки: Автоматизация оценки заявок на исследования

В рамках исследования сравниваются два подхода к отбору предложений: индивидуальная оценка (IS), агрегирующая независимые оценки рецензентов для ранжирования, и попарное сравнение (PP), определяющее ранжирование на основе результатов сравнения всех пар предложений, при этом подход PP характеризуется квадратичным ростом нагрузки, но потенциально может быть обработан с использованием больших языковых моделей.

Новое исследование показывает, как современные системы искусственного интеллекта могут эффективно оценивать научные проекты, приближаясь по точности к экспертам-людям.

Эхокардиография с искусственным интеллектом: новый взгляд на диагностику

Архитектура Echo-CoPilot использует управляемый языковой моделью контроллер, функционирующий по принципу ReAct, для обработки запросов клиницистов, взаимодействия с общей памятью и активации специализированных инструментов эхокардиографии, обеспечивающих сегментацию, классификацию изображений, предсказание измерений и заболеваний, а также генерацию отчетов и видео.

Представлена система, объединяющая передовые модели искусственного интеллекта для автоматизации анализа эхокардиограмм и повышения точности интерпретации результатов.

Разреженность дельта-функций и приватный поиск: новый взгляд

Исследование минимальной фурье-разреженности дельта-функций на булевом гиперкубе открывает возможности для создания более эффективных схем приватного извлечения информации.