Уязвимость проверки авторских прав: как обмануть алгоритмы

Наблюдается компромисс между конфиденциальностью и семантической близостью: снижение показателей MIA AUC (указывающее на усиление защиты приватности) сопровождается увеличением расхождения от исходных данных, измеряемого с помощью WordSim, при этом связь между SAGE и SAGE-R для каждого набора данных отражена в серых сегментах, а значения SPS служат для идентификации конкретных параметров.

Новое исследование показывает, что существующие методы выявления использования защищенного контента большими языковыми моделями легко обойти, используя семантически эквивалентные перефразировки.

Интеллектуальные инструменты: Новые рубежи оценки и обучения

Мета-оценка ToolPRMBench на наборах данных GTA и BFCL демонстрирует эффективность подхода в различных условиях, выявляя его устойчивость к изменениям в окружении и сложности задач.

Исследователи представили масштабный бенчмарк для оценки моделей вознаграждения, управляющих агентами, использующими инструменты, что открывает путь к более эффективному и универсальному искусственному интеллекту.

Искусственный интеллект, который ищет сам: новая стратегия обучения

Агентный поиск демонстрирует способность системы к самостоятельному определению и достижению целей, используя итеративный процесс планирования и выполнения, в котором каждый шаг направлен на максимизацию прогресса к поставленной задаче.

Исследователи разработали метод, позволяющий системам искусственного интеллекта самостоятельно улучшать качество поиска информации для более эффективного решения задач.

Память на оценку: Новый тест для «мозгов» больших языковых моделей

Сравнительный анализ показывает, что параллельное управление памятью превосходит последовательное при решении задач логического вывода в длинном контексте и генерации длинных текстов.

Исследователи представили новый способ оценки качества управления долгосрочной памятью в больших языковых моделях, выявляя слабые места существующих систем вознаграждения.

Искусственный интеллект на страже кода: новые возможности решения проблем в разработке

Предлагается систематизированная таксономия модулей, предназначенных для решения проблем с использованием больших языковых моделей, раскрывающая структуру и взаимосвязи инструментов, задействованных в процессе.

Обзор показывает, как современные модели машинного обучения автоматизируют рутинные задачи по исправлению ошибок и улучшению качества программного обеспечения.

Экономия ресурсов: Новый подход к обработке изображений и текста

Преобразование больших языковых моделей (ВLM) с использованием метода MHA2MLA-VLM обеспечивает точное соответствие входных данных механизма внимания требованиям MLA, при этом сжатие кэша KV в низком ранге согласуется с принципами MLA, что позволяет снизить потери при усечении и максимально использовать возможности повторного использования предварительно обученных весов.

Исследователи разработали метод, позволяющий значительно снизить потребление памяти в мультимодальных моделях, не жертвуя при этом качеством обработки данных.

Искусственный интеллект подсказывает случайному лесу: новый подход к обучению на малых данных

Предлагается структура ForestLLM, предназначенная для обучения табличным данным при ограниченном количестве примеров, демонстрируя подход к эффективному освоению информации в условиях дефицита данных.

Исследователи разработали систему, использующую возможности больших языковых моделей для повышения эффективности алгоритмов случайного леса при работе с ограниченным объемом данных.

По следам научных аргументов: новый тест для искусственного интеллекта

Разработана платформа SIN-Bench, преобразующая исходный код в унифицированный научный формат с применением семантического анализа, а затем, посредством итеративного цикла синтеза с использованием нескольких больших языковых моделей, перекрестной проверки и ручной аудитории, генерирует высококачественные наборы данных для оценки логических цепочек доказательств по четырем иерархическим задачам, придерживаясь принципа

Ученые представили масштабный набор данных и методику оценки, позволяющие проверить, насколько хорошо современные системы искусственного интеллекта могут находить и связывать доказательства в сложных научных текстах.