Искусственный интеллект, который ищет сам: новая стратегия обучения

Агентный поиск демонстрирует способность системы к самостоятельному определению и достижению целей, используя итеративный процесс планирования и выполнения, в котором каждый шаг направлен на максимизацию прогресса к поставленной задаче.

Исследователи разработали метод, позволяющий системам искусственного интеллекта самостоятельно улучшать качество поиска информации для более эффективного решения задач.

Память на оценку: Новый тест для «мозгов» больших языковых моделей

Сравнительный анализ показывает, что параллельное управление памятью превосходит последовательное при решении задач логического вывода в длинном контексте и генерации длинных текстов.

Исследователи представили новый способ оценки качества управления долгосрочной памятью в больших языковых моделях, выявляя слабые места существующих систем вознаграждения.

Искусственный интеллект на страже кода: новые возможности решения проблем в разработке

Предлагается систематизированная таксономия модулей, предназначенных для решения проблем с использованием больших языковых моделей, раскрывающая структуру и взаимосвязи инструментов, задействованных в процессе.

Обзор показывает, как современные модели машинного обучения автоматизируют рутинные задачи по исправлению ошибок и улучшению качества программного обеспечения.

Экономия ресурсов: Новый подход к обработке изображений и текста

Преобразование больших языковых моделей (ВLM) с использованием метода MHA2MLA-VLM обеспечивает точное соответствие входных данных механизма внимания требованиям MLA, при этом сжатие кэша KV в низком ранге согласуется с принципами MLA, что позволяет снизить потери при усечении и максимально использовать возможности повторного использования предварительно обученных весов.

Исследователи разработали метод, позволяющий значительно снизить потребление памяти в мультимодальных моделях, не жертвуя при этом качеством обработки данных.

Искусственный интеллект подсказывает случайному лесу: новый подход к обучению на малых данных

Предлагается структура ForestLLM, предназначенная для обучения табличным данным при ограниченном количестве примеров, демонстрируя подход к эффективному освоению информации в условиях дефицита данных.

Исследователи разработали систему, использующую возможности больших языковых моделей для повышения эффективности алгоритмов случайного леса при работе с ограниченным объемом данных.

Искусственный интеллект для точных вычислений: новый подход к интегралам Фейнмана

Оптимальные значения λ сопоставляются с результатами, полученными нейронной сетью, обученной с использованием метода управляемой деформации, что позволяет оценить соответствие между теоретически вычисленными параметрами и практически достигнутыми.

Исследователи предлагают использовать нейронные сети для оптимизации контурных деформаций, значительно повышая эффективность численного вычисления многомерных интегралов Фейнмана.

По следам научных аргументов: новый тест для искусственного интеллекта

Разработана платформа SIN-Bench, преобразующая исходный код в унифицированный научный формат с применением семантического анализа, а затем, посредством итеративного цикла синтеза с использованием нескольких больших языковых моделей, перекрестной проверки и ручной аудитории, генерирует высококачественные наборы данных для оценки логических цепочек доказательств по четырем иерархическим задачам, придерживаясь принципа

Ученые представили масштабный набор данных и методику оценки, позволяющие проверить, насколько хорошо современные системы искусственного интеллекта могут находить и связывать доказательства в сложных научных текстах.

Понимание кода: новый взгляд с помощью семантических графов

Структурный граф, отображающий статические связи между программными компонентами, расширяется семантическим графом, который устанавливает функциональные взаимосвязи через общие сущности предметной области - например, узел кода, представляющий обработчик заказов, соединяется с узлом сущности

Исследователи представляют LogicLens — систему, использующую семантические графы и возможности больших языковых моделей для навигации и анализа сложных многорепозиторных кодовых баз.