Интеллектуальные инструменты: Новые рубежи оценки и обучения

Мета-оценка ToolPRMBench на наборах данных GTA и BFCL демонстрирует эффективность подхода в различных условиях, выявляя его устойчивость к изменениям в окружении и сложности задач.

Исследователи представили масштабный бенчмарк для оценки моделей вознаграждения, управляющих агентами, использующими инструменты, что открывает путь к более эффективному и универсальному искусственному интеллекту.

Квантовый скачок: От теории к практике

Квантовый скачок: От теории к практике Представьте себе, что вы пытаетесь предсказать погоду, но у вас есть только очень грубые данные и неточные инструменты. Вроде того, как пытаться понять сложную систему, используя лишь приблизительные модели. Вот что сейчас происходит в квантовых вычислениях: мы на пороге использования этих мощных инструментов, но должны научиться справляться с их … Читать далее

Искусственный интеллект, который ищет сам: новая стратегия обучения

Агентный поиск демонстрирует способность системы к самостоятельному определению и достижению целей, используя итеративный процесс планирования и выполнения, в котором каждый шаг направлен на максимизацию прогресса к поставленной задаче.

Исследователи разработали метод, позволяющий системам искусственного интеллекта самостоятельно улучшать качество поиска информации для более эффективного решения задач.

Память на оценку: Новый тест для «мозгов» больших языковых моделей

Сравнительный анализ показывает, что параллельное управление памятью превосходит последовательное при решении задач логического вывода в длинном контексте и генерации длинных текстов.

Исследователи представили новый способ оценки качества управления долгосрочной памятью в больших языковых моделях, выявляя слабые места существующих систем вознаграждения.

Искусственный интеллект на страже кода: новые возможности решения проблем в разработке

Предлагается систематизированная таксономия модулей, предназначенных для решения проблем с использованием больших языковых моделей, раскрывающая структуру и взаимосвязи инструментов, задействованных в процессе.

Обзор показывает, как современные модели машинного обучения автоматизируют рутинные задачи по исправлению ошибок и улучшению качества программного обеспечения.

Искусственный интеллект подсказывает случайному лесу: новый подход к обучению на малых данных

Предлагается структура ForestLLM, предназначенная для обучения табличным данным при ограниченном количестве примеров, демонстрируя подход к эффективному освоению информации в условиях дефицита данных.

Исследователи разработали систему, использующую возможности больших языковых моделей для повышения эффективности алгоритмов случайного леса при работе с ограниченным объемом данных.

Искусственный интеллект для точных вычислений: новый подход к интегралам Фейнмана

Оптимальные значения λ сопоставляются с результатами, полученными нейронной сетью, обученной с использованием метода управляемой деформации, что позволяет оценить соответствие между теоретически вычисленными параметрами и практически достигнутыми.

Исследователи предлагают использовать нейронные сети для оптимизации контурных деформаций, значительно повышая эффективность численного вычисления многомерных интегралов Фейнмана.

Экономия ресурсов: Новый подход к обработке изображений и текста

Преобразование больших языковых моделей (ВLM) с использованием метода MHA2MLA-VLM обеспечивает точное соответствие входных данных механизма внимания требованиям MLA, при этом сжатие кэша KV в низком ранге согласуется с принципами MLA, что позволяет снизить потери при усечении и максимально использовать возможности повторного использования предварительно обученных весов.

Исследователи разработали метод, позволяющий значительно снизить потребление памяти в мультимодальных моделях, не жертвуя при этом качеством обработки данных.

Понимание кода: новый взгляд с помощью семантических графов

Структурный граф, отображающий статические связи между программными компонентами, расширяется семантическим графом, который устанавливает функциональные взаимосвязи через общие сущности предметной области - например, узел кода, представляющий обработчик заказов, соединяется с узлом сущности

Исследователи представляют LogicLens — систему, использующую семантические графы и возможности больших языковых моделей для навигации и анализа сложных многорепозиторных кодовых баз.