Искуственный интеллект: хрупкость смысла в сложных задачах

Метаморфические преобразования задач организованы по категориям, демонстрируя, как исходный текст может быть семантически сохранен при внесении ключевых модификаций, позволяющих исследовать различные аспекты решаемой проблемы.

Новое исследование показывает, что способность к логическим рассуждениям у современных ИИ-агентов не всегда устойчива к незначительным изменениям в формулировках.

Искусственный интеллект пишет код: новая платформа для обучения агентов-разработчиков

Архитектура OpenSWE представляет собой основу для разработки и развертывания систем, ориентированных на сложные вычисления, позволяя эффективно управлять ресурсами и обеспечивать масштабируемость за счет модульного подхода к построению программного обеспечения.

Исследователи представили OpenSWE — масштабную, прозрачную среду для обучения моделей искусственного интеллекта, способных решать задачи в области разработки программного обеспечения.

Глаз как зеркало Паркинсона: возможности искусственного интеллекта

Новый обзор посвящен применению технологий искусственного интеллекта для анализа изображений сетчатки глаза с целью ранней диагностики и мониторинга болезни Паркинсона.

Визуальный двойник: Как ИИ объединяет оптические и радиолокационные снимки кораблей

Сеть SDF-Net, спроектированная для точного поиска кораблей по оптическим и радиолокационным изображениям, использует последовательную обработку, начинающуюся с нейтрализации различий между сенсорами посредством кросс-модальной токенизации, затем укрепляет геометрическую стабильность с помощью обучения согласованности структуры (SCL) и, наконец, отделяет общие признаки идентичности от специфичных для сенсоров вариаций через обучение разделенным признакам (DFL) перед интеграцией, что позволяет получить устойчивые представления для точного двунаправленного кросс-модального поиска.

Новая разработка позволяет с высокой точностью идентифицировать одни и те же корабли на изображениях, полученных с помощью оптических и радиолокационных сенсоров.

Куда смотрит рука: понимание жестов в видео от первого лица

Разработан конвейер автоматической генерации вопросов с вариантами ответов для видео, снятых от первого лица, использующий как симулированные, так и реальные данные, при этом вопросы сформулированы таким образом, чтобы модель должна была визуально интерпретировать указательные жесты для определения ответа.

Новое исследование предлагает способ улучшить понимание видеозаписей от первого лица, обучая модели интерпретировать жесты и отвечать на вопросы о происходящем.

Спрашивая о справедливости: как настроить рекомендации с помощью подсказок

В ходе экспериментов с рекомендациями новостей было обнаружено, что использование нейтральных и чувствительных запросов позволяет снизить предвзятость рекомендаций, однако в некоторых случаях, запросы, учитывающие предвзятость, могут приводить к чрезмерной корректировке ответов на основе неявных признаков, таких как пол, определяемый по местоимениям.

Новое исследование показывает, что методы, основанные на текстовых подсказках, могут помочь уменьшить предвзятость в рекомендательных системах, использующих большие языковые модели.

Синергия человека и ИИ: Новый подход к материаловедению

Исследователи предлагают инновационную систему, объединяющую опыт человека и возможности искусственного интеллекта для ускорения открытия и характеризации новых материалов.

Миниатюрный поиск по изображениям: как сжать огромную модель в 70 миллионов параметров

Архитектура NanoVDR демонстрирует значительное ускорение поиска информации - до 143 раз снижение задержки на CPU по сравнению с традиционными системами VDR, достигаемое за счет разделения процессов индексации документов (с использованием замороженной большой языковой модели) и онлайн-кодирования запросов, выполняемого дистиллированной текстовой моделью размером всего 70 миллионов параметров, при этом сохраняется сопоставимая точность, подтвержденная на бенчмарке ViDoRe.

Новый подход позволяет добиться почти такой же точности поиска по визуальным документам, используя лишь компактный текстовый энкодер, значительно снижая вычислительные затраты.