Тонкая настройка больших языковых моделей: главное – скорость обучения

При оптимальной настройке скорости обучения, методы LoRA и их варианты демонстрируют схожую тенденцию к улучшению производительности при решении математических задач на модели Gemma-3-1B, вне зависимости от количества обучающих примеров, что подтверждается результатами, представленными в виде среднего значения и стандартного отклонения по трем повторным запускам.

Новое исследование показывает, что оптимизация скорости обучения может быть важнее выбора конкретного метода адаптации параметров при тонкой настройке больших языковых моделей.

Поиск редких событий: как машинное обучение ускоряет молекулярные симуляции

Метод AIMMD обучает нейронную сеть итеративно чередуя выборки с использованием TPS и обучение, а затем описывает полученную функцию коммитора через физические коллективные переменные системы с помощью символьной регрессии.

Новый метод объединяет алгоритмы машинного обучения с методом траекторных выборок, позволяя эффективно моделировать сложные химические процессы.

Расширяя горизонты: Новый подход к работе с длинными контекстами в больших языковых моделях

С использованием простой стратегии обрезки, CoPE значительно улучшает производительность RoPE как в пределах обучающего диапазона, так и при экстраполяции, демонстрируя эффективность подхода при контекстной длине в 64k.

Исследователи предлагают простой и эффективный метод улучшения обработки длинных текстов в нейронных сетях, позволяющий избежать потери смысла и артефактов.

Искусственный интеллект под завесой: проверка на социальный интеллект

В рамках исследования предложен конвейер SocialVeil, состоящий из этапов нейтрализации предвзятостей и систематического введения барьеров в сценарии, последующего моделирования многоходовых диалогов между агентами в условиях этих барьеров, и, наконец, оценки производительности агентов посредством автоматических метрик (достижение целей, поиск знаний, правдоподобность, качество отношений, степень замешательства, взаимное понимание) и экспертной оценки, направленной на анализ соответствия и успешность преодоления барьеров.

Новая методика позволяет оценить способность языковых моделей адаптироваться к сложным социальным взаимодействиям при наличии коммуникативных ограничений.

Физика в помощь причинности: новый взгляд на анализ временных рядов

Исследование демонстрирует возможность выявления причинно-следственных связей в системах с частично известной физикой, где алгоритм SCD превосходит DYNOTEARS при работе с нестационарными данными, генерируемыми стохастическими дифференциальными уравнениями, в то время как DYNOTEARS, предназначенный для стационарных линейных SVAR-моделей, демонстрирует снижение производительности в условиях рассогласования модели.

Исследование предлагает инновационный подход к выявлению причинно-следственных связей в динамических данных, используя знания физических законов.

Искусственный интеллект, который учится на ошибках: снижение неопределенности в диалоговых системах

Предлагаемый подход к оценке неопределенности агентов, основанный на различении интерактивных и доказательных действий, позволяет снизить неопределенность в процессе взаимодействия с окружающей средой и повысить надежность работы языковых моделей.

Новый подход позволяет агентам на основе больших языковых моделей более надежно действовать в динамичных средах, активно снижая уровень неопределенности в процессе взаимодействия.

Обучение языковых моделей: новый подход к передаче знаний

В ходе оценки на задачах Travel Planner и [latex]\tau\tau[/latex]-Bench (Retail, Airline) методы [latex]\pi\pi[/latex]-Distill и OPSD, использующие принципы PI, стабильно превосходят базовые модели, не имеющие доступа к информации о логике рассуждений, причём [latex]\pi\pi[/latex]-Distill демонстрирует превосходство над SFT w/ CoT + RL на TravelPlanner и также показывает лучшие результаты на [latex]\tau\tau[/latex]-Bench, что подтверждает эффективность предложенного подхода к оптимизации стратегий планирования.

Исследователи предлагают эффективные методы дистилляции современных языковых моделей в сложных интерактивных средах, даже без использования цепочки рассуждений.

Агенты и физика: новый подход к моделированию сложных систем

Архитектура PhysicsAgentABM осуществляет логический вывод на уровне кластера, комбинируя символьные и нейронные пути с учётом неопределённости, после чего происходит стохастическая реализация на уровне агентов, при этом механизм ANCHOR обеспечивает согласованность поведения при абстрагировании.

В статье представлен PhysicsAgentABM — инновационный фреймворк, объединяющий возможности искусственного интеллекта и агентного моделирования для повышения точности и масштабируемости симуляций.

Предвидение действий: новый подход к долгосрочному планированию агентов

В рамках разработанного подхода ProAct, агент искусственного интеллекта использует двухэтапную парадигму, включающую дистилляцию сложных деревьев поиска MCTS в компактные цепочки причинно-следственных связей посредством SFT, и, одновременно, использует легковесные прогоны среды MC-Crit для получения стабильных оценок ценности, что стабилизирует процесс онлайн обучения с подкреплением.

Исследователи предлагают инновационную систему, позволяющую интеллектуальным агентам более эффективно предвидеть последствия своих действий и принимать взвешенные решения в сложных интерактивных средах.