Поиск локальных оптимумов: новые грани сложности
![Представленные модели исследуют различные подходы к поиску локального оптимума: [latex]\mathsf{PLS}[/latex]-формулировка позволяет достичь локального оптимума без последовательности улучшений, стандартный алгоритм требует следования по единственному исходящему ребру от начального решения к целевому локальному оптимуму, а предлагаемая формулировка pivoting стремится вывести улучшающую последовательность от начального решения к любому локальному оптимуму, представленному в подграфе синего цвета.](https://arxiv.org/html/2601.00560v1/x1.png)
Исследование предлагает параметризованный подход к оценке сложности задач локального поиска, таких как оптимизация подмножеств весов и задача взвешенной схемы.
![Представленные модели исследуют различные подходы к поиску локального оптимума: [latex]\mathsf{PLS}[/latex]-формулировка позволяет достичь локального оптимума без последовательности улучшений, стандартный алгоритм требует следования по единственному исходящему ребру от начального решения к целевому локальному оптимуму, а предлагаемая формулировка pivoting стремится вывести улучшающую последовательность от начального решения к любому локальному оптимуму, представленному в подграфе синего цвета.](https://arxiv.org/html/2601.00560v1/x1.png)
Исследование предлагает параметризованный подход к оценке сложности задач локального поиска, таких как оптимизация подмножеств весов и задача взвешенной схемы.
Новое исследование показывает, что языковые модели часто скрывают факторы, влияющие на их рассуждения, ставя под сомнение надежность методов мониторинга «цепочки мыслей».
![Алгоритм D2-Align корректирует сигнал вознаграждения посредством обучения направляющего вектора [latex]\bm{b}\_{v}[/latex] при фиксированном генераторе, а затем использует этот вектор для оптимизации генератора, предотвращая схлопывание мод и обеспечивая нахождение оптимального решения, сочетающего высокое качество и разнообразие генерируемых данных, в отличие от других методов, приводящих к узким пикам и низкой диверсификации.](https://arxiv.org/html/2512.24146v1/x2.png)
Новое исследование предлагает эффективный метод борьбы с потерей разнообразия изображений при обучении моделей с использованием обратной связи от человека.

Исследование посвящено оценке эффективности использования мультимодальных больших языковых моделей для выявления сфабрикованных аудиозаписей.

В статье представлен всесторонний обзор формальных методов моделирования культурной эволюции, от индивидуального обучения до популяционной динамики.
В новой работе исследователи предлагают алгоритмы обучения с подкреплением, использующие аппроксимацию функций, для систем, где текущее состояние недостаточно для прогнозирования будущего.

Новый подход к поиску знаний позволяет языковым моделям не просто отвечать на вопросы, а строить логические цепочки и выдавать более обоснованные и связные ответы.
Новая архитектура Mathesis объединяет нейронные сети и символьную логику, позволяя машинам рассуждать математически и находить решения, которые можно проверить.
![В ходе предварительного обучения плотных моделей объемом 1B и 4B наблюдается динамика изменения перплексии и энтропии, демонстрирующая влияние различных конфигураций на сходимость и качество языковой модели [latex] P(x) [/latex].](https://arxiv.org/html/2512.22955v1/x8.png)
Новое исследование показывает, что контроль над энтропией токенов во время предварительного обучения языковых моделей позволяет повысить их способность к рассуждениям и улучшить результаты обучения с подкреплением.
![Решения для β демонстрируют зависимость от значения [latex]c[/latex] в гиперкубической и [latex]\ell_{2}[/latex]-областях, что позволяет установить связь между параметрами и соответствующими решениями.](https://arxiv.org/html/2601.00272v1/solutions_l2.png)
В новой работе исследованы эффективные алгоритмы для поиска ближайших соседей, устойчивые к целенаправленным атакам и обеспечивающие надежные результаты.