Искусственный интеллект — Страница 171

Тонкая настройка больших языковых моделей: главное – скорость обучения

07.02.2026 от Денис Аветисян

При оптимальной настройке скорости обучения, методы LoRA и их варианты демонстрируют схожую тенденцию к улучшению производительности при решении математических задач на модели Gemma-3-1B, вне зависимости от количества обучающих примеров, что подтверждается результатами, представленными в виде среднего значения и стандартного отклонения по трем повторным запускам.

Новое исследование показывает, что оптимизация скорости обучения может быть важнее выбора конкретного метода адаптации параметров при тонкой настройке больших языковых моделей.

Поиск редких событий: как машинное обучение ускоряет молекулярные симуляции

07.02.2026 от Денис Аветисян

Метод AIMMD обучает нейронную сеть итеративно чередуя выборки с использованием TPS и обучение, а затем описывает полученную функцию коммитора через физические коллективные переменные системы с помощью символьной регрессии.

Новый метод объединяет алгоритмы машинного обучения с методом траекторных выборок, позволяя эффективно моделировать сложные химические процессы.

Расширяя горизонты: Новый подход к работе с длинными контекстами в больших языковых моделях

06.02.2026 от Денис Аветисян

С использованием простой стратегии обрезки, CoPE значительно улучшает производительность RoPE как в пределах обучающего диапазона, так и при экстраполяции, демонстрируя эффективность подхода при контекстной длине в 64k.

Исследователи предлагают простой и эффективный метод улучшения обработки длинных текстов в нейронных сетях, позволяющий избежать потери смысла и артефактов.

Искусственный интеллект под завесой: проверка на социальный интеллект

06.02.2026 от Денис Аветисян

Новая методика позволяет оценить способность языковых моделей адаптироваться к сложным социальным взаимодействиям при наличии коммуникативных ограничений.

Физика в помощь причинности: новый взгляд на анализ временных рядов

06.02.2026 от Денис Аветисян

Исследование предлагает инновационный подход к выявлению причинно-следственных связей в динамических данных, используя знания физических законов.

Коллективный интеллект: от проб и ошибок к научному подходу

06.02.2026 от Денис Аветисян

Вместо слепого перебора решений предлагается переход к научно обоснованному подходу, где факторы, отобранные из библиотеки, формируют многоагентную систему, а последующий анализ, осуществляемый посредством Γ (призмы), позволяет отделить истинный эффект сотрудничества от простого накопления ресурсов и установить вклад каждого фактора в достигнутый результат.

Новое исследование предлагает методологию для систематической оценки и улучшения многоагентных систем, основанных на больших языковых моделях.

Искусственный интеллект, который учится на ошибках: снижение неопределенности в диалоговых системах

06.02.2026 от Денис Аветисян

Предлагаемый подход к оценке неопределенности агентов, основанный на различении интерактивных и доказательных действий, позволяет снизить неопределенность в процессе взаимодействия с окружающей средой и повысить надежность работы языковых моделей.

Новый подход позволяет агентам на основе больших языковых моделей более надежно действовать в динамичных средах, активно снижая уровень неопределенности в процессе взаимодействия.

Обучение языковых моделей: новый подход к передаче знаний

06.02.2026 от Денис Аветисян

$В ходе оценки на задачах Travel Planner и [latex]\tau\tau[/latex]-Bench (Retail, Airline) методы [latex]\pi\pi[/latex]-Distill и OPSD, использующие принципы PI, стабильно превосходят базовые модели, не имеющие доступа к информации о логике рассуждений, причём [latex]\pi\pi[/latex]-Distill демонстрирует превосходство над SFT w/ CoT + RL на TravelPlanner и также показывает лучшие результаты на [latex]\tau\tau[/latex]-Bench, что подтверждает эффективность предложенного подхода к оптимизации стратегий планирования.$

Исследователи предлагают эффективные методы дистилляции современных языковых моделей в сложных интерактивных средах, даже без использования цепочки рассуждений.

Агенты и физика: новый подход к моделированию сложных систем

06.02.2026 от Денис Аветисян

Архитектура PhysicsAgentABM осуществляет логический вывод на уровне кластера, комбинируя символьные и нейронные пути с учётом неопределённости, после чего происходит стохастическая реализация на уровне агентов, при этом механизм ANCHOR обеспечивает согласованность поведения при абстрагировании.

В статье представлен PhysicsAgentABM — инновационный фреймворк, объединяющий возможности искусственного интеллекта и агентного моделирования для повышения точности и масштабируемости симуляций.

Предвидение действий: новый подход к долгосрочному планированию агентов

06.02.2026 от Денис Аветисян

В рамках разработанного подхода ProAct, агент искусственного интеллекта использует двухэтапную парадигму, включающую дистилляцию сложных деревьев поиска MCTS в компактные цепочки причинно-следственных связей посредством SFT, и, одновременно, использует легковесные прогоны среды MC-Crit для получения стабильных оценок ценности, что стабилизирует процесс онлайн обучения с подкреплением.

Исследователи предлагают инновационную систему, позволяющую интеллектуальным агентам более эффективно предвидеть последствия своих действий и принимать взвешенные решения в сложных интерактивных средах.