Разум без обучения: Новая стратегия эффективного мышления для больших языковых моделей

Исследователи предлагают метод, позволяющий достичь сопоставимой с обучением с подкреплением способности к рассуждениям у крупных языковых моделей, используя оптимизированный алгоритм выборки.

![Исследование предлагает три подхода к построению гиперсвязей с ограничениями на многообразия, где [latex]mHC[/latex] использует итеративный алгоритм Зинкорна-Кноппа для аппроксимации дважды стохастической остаточной матрицы, [latex]mHC-lite[/latex] строит ее как выпуклые комбинации перестановочных матриц, но становится непрактичным при больших [latex]n[/latex], а предложенный [latex]KromHC[/latex] конструирует остаточную матрицу как произведения Кронекера меньших дважды стохастических матриц, гарантируя двойную стохастичность при сохранении параметрической эффективности.](https://arxiv.org/html/2601.21579v1/x1.png)



